z檢驗

用於推斷差異發生概率的方法

Z檢驗（Z Test）是一般用於大樣本（即樣本容量大於30）平均值差異性檢驗的方法。它是用標準正態分佈的理論來推斷差異發生的概率，從而比較兩個平均數的差異是否顯著。在國內也被稱作u檢驗。

當已知標準差時，驗證一組數的均值是否與某一期望值相等時，用Z檢驗。

z檢驗又叫u檢驗

目錄

1步驟 2舉例 3實現

步驟

第一步：建立虛無假設，即先假定兩個平均數之間沒有顯著差異。

第二步：計算統計量Z值，對於不同類型的問題選用不同的統計量計算方法。

1、如果檢驗一個樣本平均數x與一個已知的總體平均數μ的差異是否顯著。其Z值計算公式為：

其中：

x是檢驗樣本的平均數；

μ是已知總體的平均數；

S是總體的標準差；

n是樣本容量。

2、如果檢驗來自兩個的兩組樣本平均數的差異性，從而判斷它們各自代表的總體的差異是否顯著。其Z值計算公式為：

其中：

，是樣本1，樣本2的平均數；

是樣本1，樣本2的標準差；

是樣本1，樣本2的容量。

第三步：比較計算所得Z值與理論Z值，推斷髮生的概率，依據Z值與差異顯著性關係表作出判斷。如下表所示：

Z	P值	差異程度
		非常顯著
		顯著
		不顯著

第四步：根據是以上分析，結合具體情況，作出結論。

舉例

Z檢驗舉例

某項教育技術實驗，對實驗組和控制組的前測和后測的數據分別如下表所示，比較兩組前測和后測是否存在差異。

實驗組和控制組的前測和后測數據表

前測實驗組

控制組

后測實驗組

控制組

由於，屬於大樣本，所以採用Z檢驗。由於這是檢驗來自兩個不同總體的兩個樣本平均數，看它們各自代表的總體的差異是否顯著，所以採用雙總體的Z檢驗方法。

計算前要測Z的值：

∴ 前測兩組差異不顯著。

再計算后測Z的值:

∴ 后測兩組差異顯著。

實現

語法

描述

X為樣本值，M為，sigma為標準差，ALPHA為顯著性水平。時，表示備擇假設為“期望值不等M”（雙邊檢驗）；時，表示備擇假設為“期望值大於M”（單邊檢驗）；時，表示備擇假設為“期望值小於M”（單邊檢驗）。

當標準差sigma已知時，函數執行一正態檢驗來判斷是否來自一正態分佈的樣本的期望值，M作為評判標準來估計。在沒有重新設置的情況下，ALPHA和TAIL的默認值分別為0.05和0。

SIG為當原假設為真時得到的觀察值的概率，當SIG為小概率的時候則對原假設提出置疑。表示在顯著水平為ALPHA的情況下，不能拒絕原假設；表示在顯著性水平為ALPHA的情況下，拒絕原假設。

舉例

例題：給定一組某廠生產的紐扣直徑的數據，假設其直徑，已知，並且在標準情況下，紐扣的平均直徑應該是，問：是否可以認為這批紐扣的直徑符合標準？（）

解：總體均值和已知，則，問題就化為根據樣本值來判斷還是，為此提出假設：

原假設：

備擇假設：

Matlab實現過程如下：

程序運行結果如下：

x=

Columns 1 through 6

26.0100 26.0000 25.9800 25.8600 26.3200 25.5800

Columns 7 through 10

25.3200 25.8900 26.3200 26.1800

程序運行結果如下：

H=

SIG=

0.9622

結果，說明在0.05的水平下，不能拒絕原假設，即認為這批紐扣的直徑符合標準。

定義

設為取自正態總體的一個容量為的樣本，與分別為樣本均值與樣本方差，為已知常數， . 以下分別是關於未知參數的U檢驗方法。

（1）已知，檢驗

選擇統計量

在成立的假定下，服從分佈，對給定的顯著性水平，查標準正態分佈表可得臨界值，使得

這說明

為小概率事件。將樣本值代入算出統計量的值。如果，則表明在一次試驗中小概率事件出現了，因而拒絕，接受。在以上的假設檢驗問題中，當構造小概率事件時，利用了統計量的概率密度曲線兩側尾部的面積，這樣的檢驗稱為雙側檢驗。這裡採用雙側檢驗有直觀的解釋：因為任何情況下，都是未知參數的無偏估計，所以當成立時，即時，與不應相差太大。因此，對於固定的樣本容量，如果太大，則有理由懷疑的正確性，從而認為與有顯著差別。大到什麼程度才有足夠的理由拒絕呢？這需要由給定的顯著性水平查得的臨界值來決定。

（2）已知，檢驗

選擇統計量

並令

則. 若成立，還有

對給定的，由標準正態分佈表可得臨界值，使得

即

這說明事件“”為小概率事件。因此的拒絕域為. 將樣本值代入算出統計量的值，若，則拒絕，接受；否則可接受。

在以上的假設檢驗問題中，當構造小概率事件時，利用了的分佈概率密度曲線的單側尾部的面積，這樣的檢驗稱為單邊檢驗。直觀解釋是：如果成立，即比的值就不能大得太多。因此，對於固定的樣本容量，如果太大，則有理由懷疑的正確性。至於大到什麼程度才有足夠的理由拒絕呢？這需要由給定的顯著性水平查得的臨界值來決定。

目錄