等級線性模型

等級線性模型

等級線性模型(簡稱HLM,Hierarchical Linear Model)也稱為mixed-effect model,random-effect models或者multilevel linear models,是一種複雜的統計模型。在計量經濟學文獻中也常常被稱為Random-coefficient regression models(Rosenberg, 1973; Longford, 1993)。在某些統計學文獻種也被稱為Covariance components models(Dempster, Rubin, & Tsutakawa, 1981; Longford, 1987)。現在廣泛被使用的名稱Hierarchical Linear Model最早出現於1972年Lindley and Smith的論文以及1973年Smith的論文。

軟體


許多流行的統計軟體包都可以進行HLM的分析。最常用的包括同名軟體HLM(Raudenbush et al.,2000),MIXOR (Hedeker & Gibbons, 1996),MLWIN (Rasbash et al., 2000), SASProc Mixed (Little et al., 1996) VARCL (Longford, 1988). 貝葉斯方法在90年代由Gelfand et al.以及Mike Seltzer發展起來,現在可以在BUGS ( Spiegelhalter et al., 1994)下實現。

模型類型


在進行多級模型分析之前,研究人員必須決定幾個方面,包括哪些預測因子將被納入分析中(如果有的話)。其次,研究人員必須決定參數值(即,將被估計的元素)是固定的還是隨機的。固定參數由所有組的常數組成,而隨機參數對每個組具有不同的值。此外,研究人員必須決定是採用最大似然估計還是限制最大似然估計類型。

隨機截取模型

隨機截距模型是允許截距變化的模型,因此,每個單獨觀察的因變數的得分是通過不同組間的截距來預測的。該模型假設斜率是固定的(在不同的上下文中相同)。此外,該模型提供了有關組內相關性的信息,這有助於確定首先是否需要多級模型。

隨機斜率模型

隨機斜率模型是允許斜率變化的模型,因此,斜率在組之間是不同的。該模型假設截距是固定的(在不同的上下文中相同)。

隨機截距和斜率模型

包含隨機截距和隨機斜率的模型可能是最現實的模型類型,儘管它也是最複雜的模型。在這個模型中,允許截距和斜率在不同的組中變化,這意味著它們在不同的上下文中是不同的。

開發多層次模型

為了進行多級模型分析,可以從固定係數(斜率和截距)開始。一方面將被允許一次變化(即,將被改變),並與之前的模型進行比較,以評估更好的模型擬合。研究人員在評估模型時會提出三個不同的問題。首先,它是一個好模型嗎?第二,更複雜的模型更好嗎?第三,個人預測因子對模型有何貢獻?
為了評估模型,將檢查不同的模型擬合統計量。一個這樣的統計數據是卡方似然比檢驗,它評估模型之間的差異。似然比檢驗可以用於一般的模型構建,用於檢查當模型中的效果被允許變化時發生的情況,以及當將虛擬編碼的分類變數作為單一效應進行測試時。但是,測試只能在嵌套模型時使用(意味著更複雜的模型包含更簡單模型的所有效果)。在測試非嵌套模型時,可以使用Akaike信息準則(AIC)或貝葉斯信息準則(BIC)等進行模型之間的比較。查看更多模型選擇。

假設


多級模型具有與其他主要一般線性模型(例如,ANOVA,回歸)相同的假設,但是一些假設針對設計的分層性質(即,嵌套數據)而被修改。

線性

線性假設表明變數之間存在直線(直線,非線性或U形)關係。但是,該模型可以擴展到非線性關係。

常態

正態假設表明模型的每個級別的誤差項都是正態分佈的。然而,大多數統計軟體允許人們為方差項指定不同的分佈,例如泊松,二項式,邏輯。多級建模方法可用於所有形式的廣義線性模型。

方差齊性

同方差性的假設,也稱為方差的同質性,假設人口方差相等。然而,可以指定不同的方差 - 相關矩陣來解釋這一點,並且方差的異質性本身可以被建模。

觀察的獨立性

獨立性是一般線性模型的假設,其表明案例是來自群體的隨機樣本,並且因變數上的分數彼此獨立。多層次模型的主要目的之一是處理違反獨立性假設的情況;然而,多級模型確實假設1)1級和2級殘差是不相關的,2)最高級別的誤差(由殘差測量)是不相關的。

統計測試


在多級模型中使用的統計測試類型取決於是否正在檢查固定效應或方差分量。在檢查固定效應時,將測試與固定效應的標準誤差進行比較,從而進行Z檢驗。還可以計算t檢驗。在計算t檢驗時,重要的是要記住自由度,這取決於預測因子的水平(例如,1級預測因子或2級預測因子)。對於1級預測器,自由度基於1級預測器的數量,組的數量和單個觀察的數量。對於2級預測變數,自由度基於2級預測變數的數量和組的數量。

統計力量


多級模型的統計功效根據是否是正在檢查的1級或2級效果而不同。 1級效應的能力取決於個體觀察的數量,而2級效應的能力取決於組的數量。為了進行足夠功率的研究,多級模型需要大樣本量。然而,群體中的個體觀察數量並不像研究中的群體數量那麼重要。為了檢測跨層次的相互作用,鑒於群體規模不是太小,已經建議至少需要20個群體。多級模型中的統計功效問題因功率隨效應大小和組內相關性而變化而變得複雜,固定效應與隨機效應不同,並且根據組的數量和個體觀察的數量而變化每組。