t分佈

t分佈

在概率論和統計學中,學生t-分佈(t-distribution),可簡稱為t分佈,用於根據小樣本來估計呈正態分佈方差未知的總體的均值。如果總體方差已知(例如在樣本數量足夠多時),則應該用正態分佈來估計總體均值。

t分佈曲線形態與n(確切地說與自由度df)大小有關。與標準正態分佈曲線相比,自由度df越小,t分佈曲線愈平坦,曲線中間愈低,曲線雙側尾部翹得愈高;自由度df愈大,t分佈曲線愈接近正態分佈曲線,當自由度df=∞時,t分佈曲線為標準正態分佈曲線。

歷史


在概率論和統計學中,學生t-分佈(Student'st-distribution)經常應用在對呈正態分佈的總體的均值進行估計。它是對兩個樣本均值差異進行顯著性測試的學生t測定的基礎。t檢定改進了Z檢定(en:Z-test),不論樣本數量大或小皆可應用。在樣本數量大(超過120等)時,可以應用Z檢定,但Z檢定用在小的樣本會產生很大的誤差,因此樣本很小的情況下得改用學生t檢定。在數據有三組以上時,因為誤差無法壓低,此時可以用變異數分析代替學生t檢定。
當母群體的標準差是未知的但卻又需要估計時,我們可以運用學生t-分佈。
學生t-分佈可簡稱為t分佈。其推導由威廉·戈塞於1908年首先發表,當時他還在都柏林的健力士釀酒廠工作。因為不能以他本人的名義發表,所以論文使用了學生(Student)這一筆名。之後t檢驗以及相關理論經由羅納德·費雪的工作發揚光大,而正是他將此分佈稱為學生分佈。

定義


由於在實際工作中,往往σ是未知的,常用s作為σ的估計值,為了與u變換區別,稱為t變換,統計量t 值的分佈稱為t分佈。
假設X服從標準正態分佈N(0,1),Y服從分佈,那麼的分佈稱為自由度為n的t分佈,記為。
分佈密度函數,
t分佈
t分佈
其中,Gam(x)為伽馬函數。
t分佈
t分佈

擴展


正態分佈(normal distribution)是數理統計中的一種重要的理論分佈,是許多統計方法的理論基礎。正態分佈有兩個參數,μ和σ,決定了正態分佈的位置和形態。為了應用方便,常將一般的正態變數X通過u變換[(X-μ)/σ]轉化成標準正態變數u,以使原來各種形態的正態分佈都轉換為,的標準正態分佈(standard normal distribution),亦稱u分佈。
根據中心極限定理,通過上述的抽樣模擬試驗表明,在正態分佈總體中以固定n,抽取若干個樣本時,樣本均數的分佈仍服從正態分佈,即 。所以,對樣本均數的分佈進行u變換,也可變換為標準正態分佈N (0,1)。

特徵


1.以0為中心,左右對稱的單峰分佈;
2.t分佈是一簇曲線,其形態變化與n(確切地說與自由度df)大小有關。自由度df越小,t分佈曲線越低平;自由度df越大,t分佈曲線越接近標準正態分佈(u分佈)曲線,如圖:
t分佈
t分佈
t(n)分佈與標準正態N(0,1)的密度函數。
3.隨著自由度逐漸增大,t分佈逐漸接近標準正態分佈。
對應於每一個自由度df,就有一條t分佈曲線,每條曲線都有其曲線下統計量t的分佈規律,計算較複雜。
學生的t分佈(或也t分佈) ,在概率統計中,在置信區間估計、顯著性檢驗等問題的計算中發揮重要作用。
t分佈情況出現時(如在幾乎所有實際的統計工作)的總體標準偏差是未知的,並要從數據估算。教科書問題的處理標準偏差,因為如果它被稱為是兩類:
( 1 )那些在該樣本規模是如此之大的一個可處理的數據為基礎估計的差異,就好像它是一定的;
( 2 )這些說明數學推理,在其中的問題,估計標準偏差是暫時忽略的,因為這不是一點,這是作者或導師當時的解釋。

置信區間


假設數量A在當T呈t-分佈(T的自由度為n−1)滿足這與是相同的。A是這個概率分佈的第95個百分點。
那麼
等介於
因此μ的90%置信區間為:。

計算


下表列出了自由度為1-30以及80、100、120等t-分佈的單側和雙側區間值。例如,當樣本數量時,則自由度df=4,我們就可以查找表中以4開頭的行。該行第5列值為2.132,對應的單側值為95%(雙側值為90%)。這也就是說,T小於2.132的概率為95%(即單側),記為;同時,T值介於-2.132和2.132之間的概率為90%(即雙側),記為。
這是根據分佈的對稱性計算得到的。
因此,
注意 關於表格的最後一行的值:自由度為無限大(n=120)的t-分佈和正態分佈等價。
單側75%80%85%90%95%97.5%99%99.5%99.75%99.9%99.95%
雙側50%60%70%80%90%95%98%99%99.5%99.8%99.9%
11.0001.3761.9633.0786.31412.7131.8263.66127.3318.3636.6
20.8161.0611.3861.8862.9204.3036.9659.92514.0922.3331.60
30.7650.9781.2501.6382.3533.1824.5415.8417.45310.2112.92
40.7410.9411.1901.5332.1322.7763.7474.6045.5987.1738.610
50.7270.9201.1561.4762.0152.5713.3654.0324.7735.8936.869
60.7180.9061.1341.4401.9432.4473.1433.7074.3175.2085.959
70.7110.8961.1191.4151.8952.3652.9983.4994.0294.7855.408
80.7060.8891.1081.3971.8602.3062.8963.3553.8334.5015.041
90.7030.8831.1001.3831.8332.2622.8213.2503.6904.2974.781
100.7000.8791.0931.3721.8122.2282.7643.1693.5814.1444.587
110.6970.8761.0881.3631.7962.2012.7183.1063.4974.0254.437
120.6950.8731.0831.3561.7822.1792.6813.0553.4283.9304.318
130.6940.8701.0791.3501.7712.1602.6503.0123.3723.8524.221
140.6920.8681.0761.3451.7612.1452.6242.9773.3263.7874.140
150.6910.8661.0741.3411.7532.1312.6022.9473.2863.7334.073
160.6900.8651.0711.3371.7462.1202.5832.9213.2523.6864.015
170.6890.8631.0691.3331.7402.1102.5672.8983.2223.6463.965
180.6880.8621.0671.3301.7342.1012.5522.8783.1973.6103.922
190.6880.8611.0661.3281.7292.0932.5392.8613.1743.5793.883
200.6870.8601.0641.3251.7252.0862.5282.8453.1533.5523.850
210.6860.8591.0631.3231.7212.0802.5182.8313.1353.5273.819
220.6860.8581.0611.3211.7172.0742.5082.8193.1193.5053.792
230.6850.8581.0601.3191.7142.0692.5002.8073.1043.4853.767
240.6850.8571.0591.3181.7112.0642.4922.7973.0913.4673.745
250.6840.8561.0581.3161.7082.0602.4852.7873.0783.4503.725
260.6840.8561.0581.3151.7062.0562.4792.7793.0673.4353.707
270.6840.8551.0571.3141.7032.0522.4732.7713.0573.4213.690
280.6830.8551.0561.3131.7012.0482.4672.7633.0473.4083.674
290.6830.8541.0551.3111.6992.0452.4622.7563.0383.3963.659
300.6830.8541.0551.3101.6972.0422.4572.7503.0303.3853.646
400.6810.8511.0501.3031.6842.0212.4232.7042.9713.3073.551
500.6790.8491.0471.2991.6762.0092.4032.6782.9373.2613.496
600.6790.8481.0451.2961.6712.0002.3902.6602.9153.2323.460
800.6780.8461.0431.2921.6641.9902.3742.6392.8873.1953.416
1000.6770.8451.0421.2901.6601.9842.3642.6262.8713.1743.390
1200.6770.8451.0411.2891.6581.9802.3582.6172.8603.1603.373
無窮大0.6740.8421.0361.2821.6451.9602.3262.5762.8073.0903.291