離差平方和
各項與平均項之差的平方的總和
離差平方和(Sum of Squares of Deviations)是各項與平均項之差的平方的總和。定義是設x是一個隨機變數,令η=x-Ex, 則 稱 η為x的離差,它反映了x與其數學期望Ex的偏離程度。
設x是一個隨機變數,令, 則 稱 η為x的離差。它反映了x與其數學期望Ex的偏離程度.
離差平方和與方差的關係
根據數學期望的性質,離差的數學期望總是等於0,沒有實用價值
通常用隨機變數x 離差的平方的數學期望來描述隨機變數x的分佈的分散程度,並把其稱為x的方差,記作Dx
總體方差,樣本方差
離差平方和
離差平方和的樣本計算
一般用計算機計算。以excel為例:先用Varp計算總體方差,然後,求出離差平方和。
通過對離差平方和的分解進行方差分析。統計學的實踐表明, 於某一特性量經過多次試驗的結果,一 般不會是同一數值, 是彼此有差異, 這種差異反映了這試驗受各種條件( 稱為因素) 制約. 離差平方和就反映了這種制約因素引起的差異大小. 為解決此問題, 英國統計學家Fisher提 出了方差分析的方法, 基本思想是將總的離差平方和分解為幾個部分, 每一部分反映了方差的一種來源, 然後利用F分佈進行檢驗 .
離差平方和的分解類似於物理學的平行軸定理
單因素方差分析,離差平方和的分解:
其中代表誤差平方和,代表總離差平方和,代表處理A的不同水平間的離差平方和
將所有數據用Varp求方差,
A的每個水平都有若干個數據,假設A有k個水平,對這k個組求各自的離差平方和,得到組內誤差:
各個組的誤差相加得到總的誤差平方和:
最後根據 求出A的處理平方和
這是方差分析的第一步。
如果 每個分組的數據一樣多,也可以這樣做:
求出每個組的平均值,對這些平均值求方差,再乘以N,得到
試想,如果每個分組只有一個數據,此時沒有組內平方和,所以,分組平均值的離差平方和就是 。
對於兩因素無交互的方差分析(假設共有N個數據)
和單因素相同,求出
先按照A的水平分組,求出每個組的平均值,對這些平均值求方差,再乘以N,得到
同理得到
最後求
接下來的F檢驗參見方差分析。