t檢驗
t檢驗
t檢驗,亦稱student t檢驗(Student's t test),主要用於樣本含量較小(例如n < 30),總體標準差σ未知的正態分佈。 t檢驗是用t分佈理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著。它與f檢驗、卡方檢驗並列。t檢驗是戈斯特為了觀測釀酒質量而發明的,並於1908年在Biometrika上公布。
t檢驗分為單總體檢驗和雙總體檢驗。
單總體t檢驗是檢驗一個樣本平均數與一個已知的總體平均數的差異是否顯著。當總體分佈是正態分佈,如總體標準差未知且樣本容量小於30,那麼樣本平均數與總體平均數的離差統計量呈t分佈。
單總體t檢驗統計量為:
其中,為樣本標準偏差,n為樣本數。該統計量t在零假說:μ=μ0為真的條件下服從自由度為n−1的t分佈。
雙總體t檢驗是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。雙總體t檢驗又分為兩種情況,一是獨立樣本t檢驗,一是配對樣本t檢驗。
獨立樣本t檢驗統計量為:
和為兩樣本方差;n1和n2為兩樣本容量。
配對樣本t檢驗可視為單樣本t檢驗的擴展,不過檢驗的對象由一群來自常態分配獨立樣本更改為二群配對樣本之觀測值之差。
若二群配對樣本x1i與x2i之差為di=x1i−x2i獨立且來自常態分配,則di之母體期望值μ是否為μ0可利用以下統計量:
其中為配對樣本差值之平均數,為配對樣本差值之標準偏差,n為配對樣本數。該統計量t在零假說:μ=μ0為真的條件下服從自由度為n−1的t分佈。
(1)已知一個總體均數;
(2)可得到一個樣本均數及該樣本標準差;
(3)樣本來自正態或近似正態總體。
以單總體t檢驗為例說明:
問題:難產兒出生數n=35,體重均值 =3.42,S =0.40,一般嬰兒出生體重μ0=3.30(大規模調查獲得),問相同否?
解:1.建立假設、確定檢驗水準α
H0:μ = μ0 (零假設null hypothesis)
H1:μ ≠ μ0(備擇假設alternative hypothesis)
雙側檢驗,檢驗水準:α=0.05
2.計算檢驗統計量
=1.77
3.查相應界值表,確定P值,下結論。
查附表1,t0.025 / 34 = 2.032,t < t0.025 / 34,P >0.05,按α=0.05水準,不拒絕H0,兩者的差別無統計學意義
t檢驗
當總體呈正態分佈,如果總體標準差未知,而且樣本容量<30,那麼這時一切可能的樣本平均數與總體平均數的離差統計量呈t分佈。
檢驗是用分佈理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著。檢驗分為單總體檢驗和雙總體檢驗。
1.單總體t檢驗
單總體檢驗是檢驗一個樣本平均數與一已知的總體平均數的差異是否顯著。當總體分佈是正態分佈,如總體標準差未知且樣本容量<30,那麼樣本平均數與總體平均數的離差統計量呈正態分佈。
2.雙總體t檢驗
雙總體檢驗是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。雙總體檢驗又分為兩種情況,一是相關樣本平均數差異的顯著性檢驗,用於檢驗匹配而成的兩組被試獲得的數據或同組被試在不同條件下所獲得的數據的差異性,這兩種情況組成的樣本即為相關樣本。二是獨立樣本平均數的顯著性檢驗。各實驗處理組之間毫無相關存在,即為獨立樣本。該檢驗用於檢驗兩組非相關樣本被試所獲得的數據的差異性。
1、選用的檢驗方法必須符合其適用條件(注意:t檢驗的前提:1.來自正態分佈總體2.隨機樣本3.均數比較時,要求倆總體方差相等,即具有方差齊性)。理論上,即使樣本量很小時,也可以進行t檢驗。(如樣本量為10,一些學者聲稱甚至更小的樣本也行),只要每組中變數呈正態分佈,兩組方差不會明顯不同。如上所述,可以通過觀察數據的分佈或進行正態性檢驗估計數據的正態假設。方差齊性的假設可進行F檢驗,或進行更有效的Levene's檢驗。如果不滿足這些條件,可以採用校正的t檢驗,或者換用非參數檢驗代替t檢驗進行兩組間均值的比較。
2、區分單側檢驗和雙側檢驗。單側檢驗的界值小於雙側檢驗的界值,因此更容易拒絕,犯第Ⅰ錯誤的可能性大。t檢驗中的p值是接受兩均值存在差異這個假設可能犯錯的概率。在統計學上,當兩組觀察對象總體中的確不存在差別時,這個概率與我們拒絕了該假設有關。一些學者認為如果差異具有特定的方向性,我們只要考慮單側概率分佈,將所得到t-檢驗的P值分為兩半。另一些學者則認為無論何種情況下都要報告標準的雙側t檢驗概率。
3、假設檢驗的結論不能絕對化。當一個統計量的值落在臨界域內,這個統計量是統計上顯著的,這時拒絕虛擬假設。當一個統計量的值落在接受域中,這個檢驗是統計上不顯著的,這是不拒絕虛擬假設H0。因為,其不顯著結果的原因有可能是樣本數量不夠拒絕H0,有可能犯第Ⅰ類錯誤。
4、正確理解P值與差別有無統計學意義。P越小,不是說明實際差別越大,而是說越有理由拒絕H0 ,越有理由說明兩者有差異,差別有無統計學意義和有無專業上的實際意義並不完全相同。
5、假設檢驗和可信區間的關係結論具有一致性差異:提供的信息不同區間估計給出總體均值可能取值範圍,但不給出確切的概率值,假設檢驗可以給出H0成立與否的概率。
6、涉及多組間比較時,慎用t檢驗。
科研實踐中,經常需要進行兩組以上比較,或含有多個自變數並控制各個自變數單獨效應后的各組間的比較,(如性別、藥物類型與劑量),此時,需要用方差分析進行數據分析,方差分析被認為是T檢驗的推廣。在較為複雜的設計時,方差分析具有許多t-檢驗所不具備的優點。(進行多次的T檢驗進行比較設計中不同格子均值時)。
例如,t檢驗可用於比較男女身高是否存在差別。
為了進行獨立樣本t檢驗,需要一個自(分組)變數(如性別:男女)與一個因變數(如測量值)。根據自變數的特定值,比較各組中因變數的均值。用t檢驗比較下列男、女兒童身高的均值。
1、假設
H0:男平均身高=女平均身高
H1:男身高 不等於 女平均身高
選用雙側檢驗
選用alpha=0.05的統計顯著水平。
2、SPSS中的數據的排列
被試 | 性別 | 身高 |
對象1 對象2 對象3 對象4 對象5 | 男性 男性 男性 女性 女性 | 111 110 109 102 104 |
男性身高均數 = 110 女性身高均數 = 103 |
3、選擇SPSS中compare means菜單,獨立樣本, t-test。選擇雙側檢驗,以及統計顯著性水平alpha0.05 運行。
4、從輸出結果查看t檢驗的p值,是否達到顯著水平。是,接受H1。男平均身高與女平均身高不同。否,接受H0,尚無證據支持男女身高差異。
5、最常用t檢驗的情況有:
● 單樣本檢驗:檢驗一個正態分佈的總體的均值是否在滿足零假設的值之內。
● 雙樣本檢驗:其零假設為兩個正態分佈的總體的均值是相同的。這一檢驗通常被稱為學生t檢驗。但更為嚴格地說,只有兩個總體的方差是相等的情況下,才稱為學生t檢驗;否則,有時被稱為Welch檢驗。以上談到的檢驗一般被稱作“未配對”或“獨立樣本”t檢驗,我們特別是在兩個被檢驗的樣本沒有重疊部分時用到這種檢驗方式。
● 檢驗同一統計量的兩次測量值之間的差異是否為零。舉例來說,我們測量一位病人接受治療前和治療后的腫瘤尺寸大小。如果治療是有效的,我們可以推定多數病人接受治療后,腫瘤尺寸變小了。這種檢驗一般被稱作“配對”或者“重複測量”t檢驗。
● 檢驗一條回歸線的斜率是否顯著不為零。
● 大多數的試算表軟體及統計軟體,諸如QtiPlot、OpenOffice.org Calc、LibreOffice Calc、Microsoft Excel、SAS、SPSS、Stata、DAP、gretl、R、Python、PSPP、Minitab等,都可以進行t檢驗之運算。