零假設

零假設

零假設(null hypothesis),統計學術語,又稱原假設,指進行統計檢驗時預先建立的假設。零假設成立時,有關統計量應服從已知的某種概率分佈。當統計量的計算值落入否定域時,可知發生了小概率事件,應否定原假設。零假設不過是我們研究兩個事物之間是否有關的時候我們能做出的最保守的假設。零假設的內容一般是希望證明其錯誤的假設。費希爾和洛奇能做的最簡單的事情,就是倒一杯奶茶,不讓布里斯托看見,然後給她嘗,看她能不能猜對是先加的奶還是先加的茶。

簡介


在 統計學中,零假設(虛無假設)是做 統計檢驗時的一類 假設。零假設的內容一般是希望證明其錯誤的假設。比如說,在相關性檢驗中,一般會取“兩者之間沒有關聯”作為零假設,而在 獨立性檢驗中,一般會取“兩者之間有關聯”作為零假設。與零假設相對的是 備擇假設(對立假設),即不希望看到的另一種可能。從 數學上來看,零假設和備擇假設的地位是相等的,但是在統計學的實際運用中,常常需要強調一類假設為應當或期望實現的假設。如果一個統計檢驗的結果 拒絕零假設(結論不支持零假設),而實際上真實的情況屬於零假設,那麼稱這個檢驗犯了 第一類錯誤。反之,如果檢驗結果支持零假設,而實際上真實的情況屬於備擇假設,那麼稱這個檢驗犯了 第二類錯誤。通常的做法是,在保持第一類錯誤出現的機會在某個特定水平上的時候,盡量減少 第二類錯誤出現的概率。

釋義


看到零假設的時候我們會自然地發問,這個“假設”太奇怪了,竟然叫零假設,難道還有什麼一假設和二假設嗎?換句話說,假設是可用數字來計量的嗎?對這個問題有一個好的理解的辦法可能需要提到相關係數,還有就是關於假設的一些簡單陳述。當我們想理解兩個事件是否相關的時候,我們用相關係數來測量它們之間的相關程度,它是介於-1到1的一個數值。當 相關係數是零的時候,我們說這兩個事件沒有關係。假設就是我們對兩個事件之間關係的某種猜測。因此,如果我們要研究兩個事件的關係時,零假設的意思就是說,兩件事情之間沒有關係。
當然,零假設仍然是一種假設,並不是對世界運動的客觀描述,至少在沒有證明它是正確的情形下這樣的表達是可靠的。零假設不過是我們研究兩個事物之間是否有關的時候我們能做出的最保守的假設。如果我們想知道溫室氣體排放的增加和全球變暖之間的關係,而在研究之前我們沒有做過任何的研究和調查,我們最保險的辦法就是認為這兩者之間沒有關係,這就是零假設。因為在研究之前我們不知道它們之間是什麼樣的關係,所以我們寧可認為它們之間沒有關係。然後通過我們科學的調查研究,再排除那些偶然性的因素之後,我們得到的結論是 溫室氣體排放使和全球變暖。
正如上面所提到的,零假設還要讓我們接受偶然性。許多事情的發生出於偶然,這是一個基本事實。由於偶然而導致兩個事情看起來有關係,或者說有關係,但實際上我們還是認為這兩者之間的關係仍然是不相關的,用零假設來描述它們的關係仍然是恰當的。偶然性是一個讓人著迷又易犯錯誤的領域,儘管它確實存在,但是在對它進行研究的人們仍然是我們人類中的強者。我們所要研究的是,在排除這些偶然性的因素之後得到的兩者之間的必然聯繫。只有這樣的結論才是可靠的,運用這樣的結論來改造世界才是安全的。

確定標準


1零假設一般是有意推翻的假設;
2由於第一類錯誤的 概率可以通過 顯著性水平的選定加以控制,零假設一般是如果出現第一類錯誤后後果更為嚴重的情況的假設。

確定思路


在假定零假設為真的前提下,確定 樣本分佈形態和 特徵值(包括期望和 方差)並選擇合適的 統計量,然後,確定包括接受域,臨界值和 拒絕域在內的決策標準;根據樣本數據計算出統計量並將其與決策標準比后得出結論。其間決策標準的邏輯意義在於,零假設為真時的 樣本分佈中,抽樣數據落在 拒絕域被設定為小概率事件,而小概率事件在一次試驗中幾乎是不可能發生的,一旦發生,可認定樣本數據落在拒絕域並非小概率事件,零假設為真的前提可以被推翻。

趣聞


人們通常認為科學家的工作是證明一個假設的正確性——比如說電子的存在,或者某個藥物可以治癒癌症。但是,大部分時候,科學家做著相反的工作:他們需要推翻假設。
這個方法經過科學家們數十年的發展和完善,但是20世紀20年代初的一個下午在這段歷史過程中尤其引人注目。那是在英格蘭的一個農業研究站,三位科學家在喝下午茶。一位叫做羅納德·費希爾(Ronald Fisher)的統計學家倒了一杯奶茶端給了他的同事,穆麗爾·布里斯托(Muriel Bristol)。
布里斯托拒絕了這杯茶。她更喜歡先倒牛奶后倒茶的味道。
“怎麼可能。”據說費希爾這樣回答道,“先倒牛奶還是后倒牛奶當然沒有區別。”
但是布里斯托態度堅定。她堅持說,她可以嘗出其中的區別。
對話的第三個科學家,威廉姆·洛奇(William Roach),建議大家做個試驗。(這或許其實是個科學勾搭的時刻:布里斯托和洛奇1923年結婚了。)
但是如何測試布里斯托的宣稱呢?費希爾和洛奇能做的最簡單的事情,就是倒一杯奶茶,不讓布里斯托看見,然後給她嘗,看她能不能猜對是先加的奶還是先加的茶。
不過,就算她說對了,也並不見得能證明她對茶的有著獨到的鑒賞力。考慮到有50%的概率可以答對,她完全可以全靠蒙來猜中答案。
多年之後,費希爾在他1935出版的書《 實驗設計》中描述了應該如何檢驗這樣的宣稱。他不是去試圖證明布里斯托可以嘗出兩種茶的區別,而是試圖駁斥這樣的假設:“布里斯托的選擇是隨機的”。“我們可以稱這樣的假設為‘零假設’,”費希爾寫到,“零假設永遠無法證明或者確定,但是可能通過實驗手段被否定。可以說,每個實驗存在的目的,都不過是為了給事實提供一個機會去推翻零假設。”
費希爾概述了一種方式來駁斥零假設——布里斯托的選擇是隨機的。他會準備8杯茶,4杯先放牛奶,4杯後放牛奶。然後他會打亂杯子的順序,讓布里斯托每次品嘗一杯。她需要將8杯茶分兩組,一組她認為是先放了牛奶的,另外一組是後放了牛奶的。
據說布里斯托不費吹灰之力滿分過關,正確地分辨出全部8杯茶。由於費希爾的實驗設計,她全靠瞎猜將8杯茶全部正確分類的概率很小。8杯茶平分成2組有整整70種不同組合,也就是說布里斯托完全蒙對答案的概率只有1/70。
費希爾的檢測依然不能完全排除布里斯托是猜對的可能性。只是說,她都是猜對的可能性很小。他可以通過讓布里斯托喝更多的茶進一步降低這種可能性,但是他永遠不可能把這種可能性降到0。
既然絕對的證明是不可能的,費希爾在做實驗的時候更傾向於考慮可操作性。在他和布里斯托工作的農業實驗室,費希爾的工作就是分析幾十年採集的數據來確定這些信息是否有價值,比如,能判斷出作物肥料的最佳配方是什麼。科學家可以用這些數據來設計規模更大的實驗來得到更精確的結果。費希爾認為,設計一個需要歷經數百年才能得到結果的實驗沒有任何意義。他相信,等到可能性低到一定程度的時候,見好就收也足夠了。
他認為5%就是一個合理的閾值。如果我們假定某個零假設是正確的,卻發現在零假設下觀察到這種數據的概率不到5%,那我們就可以很安全地“拒絕”零假設了。在布里斯托的例子中,她猜對的概率遠遠小於費希爾的閾值,只有1.4%。
很大程度上多虧了費希爾,零假設已經成為了科學發現的一個重要工具。你可以在每一個科學分支找到零假設的影子,從心理學到病毒學到宇宙學。並且,科學家們延續了費希爾5%的閾值概率。