計量經濟模型
計量經濟模型
計量經濟模型是用截面數據作為計量經濟學模型的樣本數據,應注意以下幾個問題。一是樣本與母體的一致性問題。計量經濟學模型的參數估計,從數學上講,是用從母體中隨機抽取的個體樣本估計母體的參數,那麼要求母體與個體必須是一致的。例如,估計煤炭企業的生產函數模型,只能用煤炭企業的數據作為樣本,不能用煤炭行業的數據。那麼,截面數據就很難用於一些總量模型的估計,例如,建立煤炭行業的生產函數模型,就無法得到合適的截面數據。
計量經濟模型
廣義地說,一切包括經濟、數學、統計三者的模型;
狹義地說,僅只用參數估計和假設檢驗的數理統計方法研究經驗數據的模型。
理論模型的設計
計量經濟模型
在單方程模型中,變數分為兩類。作為研究對象的變數,也就是因果關係中的“果”,例如生產函數中的產出量,是模型中的被解釋變數;而作為“原因”的變數,例如生產函數中的資本、勞動、技術,是模型中的解釋變數。確定模型所包含的變數,主要是指確定解釋變數。可以作為解釋變數的有下列幾類變數:外生經濟變數、外生條件變數、外生政策變數和滯后被解釋變數。其中有些變數,如政策變數、條件變數經常以虛變數的形式出現。
嚴格地說,上述生產函數中的產出量、資本、勞動、技術等,只能稱為“因素”,這些因素間存在著因果關係。為了建立起計量經濟學模型,必須選擇適當的變數來表徵這些因素,這些變數必須具有數據可得性。於是,我們可以用總產值來表徵產出量,用固定資產原值來表徵資本,用職工人數來表徵勞動,用時間作為一個變數來表徵技術。這樣,最後建立的模型是關於總產值、固定資產原值、職工人數和時間變數之間關係的數學表達式。下面,為了敘述方便,我們將“因素”與“變數”間的區別暫時略去,都以“變數”來表示。
關鍵在於,在確定了被解釋變數之後,怎樣才能正確地選擇解釋變數。
首先,需要正確理解和把握所研究的經濟現象中暗含的經濟學理論和經濟行為規律。這是正確選擇解釋變數的基礎。例如,在上述生產問題中,已經明確指出屬於供給不足的情況,那麼,影響產出量的因素就應該在投入要素方面,而在當前,一般的投入要素主要是技術、資本與勞動。如果屬於需求不足的情況,那麼影響產出量的因素就應該在需求方面,而不在投入要素方面。這時,如果研究的對象是消費品生產,應該選擇居民收入等變數作為解釋變數;如果研究的對象是生產資料生產,應該選擇固定資產投資總額等變數作為解釋變數。由此可見,同樣是建立生產模型,所處的經濟環境不同、研究的行業不同,變數選擇是不同的。
其次,選擇變數要考慮數據的可得性。這就要求對經濟統計學有透徹的了解。計量經濟學模型是要在樣本數據,即變數的樣本觀測值的支持下,採用一定的數學方法估計參數,以揭示變數之間的定量關係。所以所選擇的變數必須是統計指標體系中存在的、有可靠的數據來源的。如果必須引入個別對被解釋變數有重要影響的政策變數、條件變數,則採用虛變數的樣本觀測值的選取方法。
第三,選擇變數時要考慮所有入選變數之間的關係,使得每一個解釋變數都是獨立的。這是計量經濟學模型技術所要求的。當然,在開始時要做到這一點是困難的,如果在所有入選變數中出現相關的變數,可以在建模過程中檢驗並予以剔除。
從這裡可以看出,建立模型的第一步就已經體現了計量經濟學是經濟理論、經濟統計學和數學三者結合的思想。
在選擇變數時,錯誤是容易發生的。下面的例子都是從已有的計量經濟學應用研究成果中發現的,代表了幾類容易發生的錯誤。例如
農副產品出口額 = -107.66+0.13×社會商品零售總額十0.22×農副產品收購額
這裡選擇了無關的變數,因為社會商品零售總額與農副產品出口額無直接關係,更不是影響農副產品出口額的原因。再如
生產資料進口額 = 0.73×輕工業投資+0.21×出口額+0.18×生產消費+67.60×進出口政策
這裡選擇了不重要的變數,因為輕工業投資對生產資料進口額雖有影響,但不是重要的,或者說是不完全的,重要的是全社會固定資產投資額,應該選擇這個變數。再如
農業總產值 = 0.78+0.24×糧食產量+0.05×農機動力—0.21×受災面積
這裡選擇了不獨立的變數,因為糧食產量是受農機動力和受災面積影響的,它們之間存在相關性。
值得注意的是上述幾個模型都能很好地擬合樣本數據,所以絕對不能把對樣本數據的擬合程度作為判斷模型變數選擇是否正確的主要標準。
變數的選擇不是一次完成的,往往要經過多次反覆。
確定模型的數學形式
選擇了適當的變數,接下來就要選擇適當的數學形式描述這些變數之間的關係,即建立理論模型。
選擇模型數學形式的主要依據是經濟行為理論。在數理經濟學中,已經對常用的生產函數、需求函數、消費函數、投資函數等模型的數學形式進行了廣泛的研究,可以借鑒這些研究成果。需要指出的是,現代經濟學尤其注重實證研究,任何建立在一定經濟學理論假設基礎上的理論模型,如果不能很好地解釋過去,尤其是歷史統計數據,那麼它是不能為人們所接受的。這就要求理論模型的建立要在參數估計、模型檢驗的全過程中反覆修改,以得到一種既能有較好的經濟學解釋又能較好地反映歷史上已經發生的諸變數之間關係的數學模型。忽視任何一方面都是不對的。
計量經濟模型
理論模型中的待估參數一般都具有特定的經濟含義,它們的數值,要待模型估計、檢驗后,即經濟數學模型完成後才能確定,但對於它們的數值範圍,即理論期望值,可以根據它們的經濟含義在開始時擬定。這一理論期望值可以用來檢驗模型的估計結果。
擬定理論模型中待估參數的理論期望值,關鍵在於理解待估參數的經濟含義。例如上述生產函數理論模型中有4個待估參數和α、β、γ和A。其中,α是資本的產出彈性,β是勞動的產出彈性,γ近似為技術進步速度,A是效率係數。根據這些經濟含義,它們的數值範圍應該是
0<α<1,0<β<1,α+β≈1,0<γ0。
樣本數據的收集
樣本數據的收集與整理,是建立計量經濟學模型過程中最為費時費力的工作,也是對模型質量影響極大的一項工作。從工作程序上講,它是在理論模型建立之後進行,但實際上經常是同時進行的,因為能否收集到合適的樣本觀測值是決定變數取捨的主要因素之一。
1. 幾類常用的樣本數據
常用的樣本數據有三類:時間序列數據、截面數據和虛變數數據。
時間序列數據是一批按照時間先後排列的統計數據,一般由統計部門提供,在建立計量經濟學模型時應充分加以利用,以減少收集數據的工作量。在利用時間序列數據作樣本時,要注意以下幾個問題。一是所選擇的樣本區間內經濟行為的一致性問題。例如,我們建立紡織行業生產模型,選擇反映市場需求因素的變數,諸如居民收入、出口額等作為解釋變數,而沒有選擇反映生產能力的變數,諸如資本、勞動等,原因是紡織行業屬於供大於求的情況。對於這個模型,利用時間序列數據作樣本時,只能選擇80年代後期以來的數據,因為紡織行業供大於求的局面只出現在這個階段,而在80年代中期以前的一個長時期里,我國紡織品是供不應求的,那時制約行業產出量的主要因素是投入要素。二是樣本數據在不同樣本點之間的可比性問題。經濟變數的時間序列數據往往是以價值形態出現的,包含了價格因素,而同一件實物在不同年份的價格是不同的,這就造成樣本數據在不同樣本點之間不可比。需要對原始數據進行調整,消除其不可比因素,方可作為模型的樣本數據。三是樣本觀測值過於集中的問題。經濟變數在時間序列上的變化往往是緩慢的,例如,居民收入每年的變化幅度只有5%左右。如果在一個消費函數模型中,以居民消費作為被解釋變數,以居民收入作為解釋變數,以它的時間序列數據作為解釋變數的樣本數據,由於樣本數據過於集中,所建立的模型很難反映兩個變數之間的長期關係。這也是時間序列不適宜於對模型中反映長期變化關係的結構參數的估計的一個主要原因。四是模型隨機誤差項的序列相關問題。用時間序列數據作樣本,容易引起模型隨機誤差項產生序列相關。這個問題後面還要專門討論。
截面數據是一批發生在同一時間截面上的調查數據。例如,工業普查數據、人口普查數據、家計調查數據等,主要由統計部門提供。用截面數據作為計量經濟學模型的樣本數據,應注意以下幾個問題。一是樣本與母體的一致性問題。計量經濟學模型的參數估計,從數學上講,是用從母體中隨機抽取的個體樣本估計母體的參數,那麼要求母體與個體必須是一致的。例如,估計煤炭企業的生產函數模型,只能用煤炭企業的數據作為樣本,不能用煤炭行業的數據。那麼,截面數據就很難用於一些總量模型的估計,例如,建立煤炭行業的生產函數模型,就無法得到合適的截面數據。二是模型隨機誤差項的異方差問題。用截面數據作樣本,容易引起模型隨機誤差項產生異方差。這個問題後面還要專門討論。
虛變數數據也稱為二進位數據,一般取0或1。虛變數經常被用在計量經濟學模型中,以表徵政策、條件等因素。例如,建立我國的糧食生產計量經濟學模型,以糧食產量作為被解釋變數,解釋變數中除了播種面積、化肥使用量、農機總動力、成災面積等變數外,顯然,政策因素是不可忽略的。1980年前後,由於實行了不同的政策,即使上述變數都沒有變化,糧食產量也會發生大的變化。於是必須在解釋變數中引人政策變數,用一個虛變數表示,對於1980年以後的年份,該虛變數的樣本觀測值為1,對於1980年以前的年份,該虛變數的樣本觀測值為0。也可以取0、l以外的數值,表示該因素的變化程度。例如,在工業生產模型中用虛變數表示氣候對工業生產的影響,可以將不同年份氣候的影響程度,分別用0、1、-1,甚至0.5、-0.5等表示。不過,這種方法應慎用,以免違背客觀性。
2. 樣本數據的質量
樣本數據的質量問題大體上可以概括為完整性、準確性、可比性和一致性四個方面。
完整性,即模型中包含的所有變數都必須得到相同容量的樣本觀測值。這既是模型參數估計的需要,也是經濟現象本身應該具有的特徵。但是,在實際中,“遺失數據”的現象是經常發生的,尤其在中國,經濟體制和核算體系都處於轉軌之中。在出現“遺失數據”時,如果樣本容量足夠大,樣本點之間的聯繫並不緊密的情況下,可以將“遺失數據”所在的樣本點整個地去掉;如果樣本容量有限,或者樣本點之間的聯繫緊密,去掉某個樣本點會影響模型的估計質量,則要採取特定的技術將“遺失數據”補上。
準確性,有兩方面含義,一是所得到的數據必須準確反映它所描述的經濟因素的狀態,即統計數據或調查數據本身是準確的;二是它必須是模型研究中所準確需要的,即滿足模型對變數口徑的要求。前一個方面是顯而易見的,而後一個方面則容易被忽視。例如,在生產函數模型中,作為解釋變數的資本、勞動等必須是投入到生產過程中的、對產出量起作用的那部分生產要素,以勞動為例,應該是投入到生產過程中的、對產出量起作用的那部分勞動者。於是,在收集樣本數據時,就應該收集生產性職工人數,而不能以全體職工人數作為樣本數據,儘管全體職工人數在統計上是很準確的,但其中有相當一部分與生產過程無關,不是模型所需要的。
可比性,也就是通常所說的數據口徑問題,在計量經濟學模型研究中可以說無處不在。而人們容易得到的經濟統計數據,一般可比性較差,其原因在於統計範圍口徑的變化和價格口徑的變化,必須進行處理后才能用於模型參數的估計。計量經濟學方法,是從樣本數據中尋找經濟活動本身客觀存在的規律性,如果數據是不可比的,得到的規律性就難以反映實際。不同的研究者研究同一個經濟現象,採用同樣的變數和數學形式,選擇的樣本點也相同,但可能得到相差甚遠的模型參數估計結果。為什麼?原因在於樣本數據的可比性。例如,採用時間序列數據作為生產函數模型的樣本數據,產出量用不變價格計算的總產值,在不同年份間是可比的;資本用當年價格計算的固定資產原值,在不同年份間是不可比的。對於統計資料中直接提供的這個用當年價格計算的固定資產原值,有人直接用於模型估計,有人進行處理后再用於模型的估計,結果當然不會相同。
一致性,即母體與樣本的一致性。上面在討論用截面數據作為計量經濟學模型的樣本數據時已經作了介紹。違反一致性的情況經常會發生,例如,用企業的數據作為行業生產函數模型的樣本數據,用人均收入與消費的數據作為總量消費函數模型的樣本數據,用31個省份的數據作為全國總量模型的樣本數據,等等。
模型參數的估計
模型參數的估計方法,是計量經濟學的核心內容。在建立了理論模型並收集整理了符合模型要求的樣本數據之後,就可以選擇適當的方法估計模型,得到模型參數的估計量。模型參數的估計是一個純技術的過程,包括對模型進行識別(對聯立方程模型而言)、估計方法的選擇、軟體的應用等內容。在後面的章節中將用大量的篇幅討論估計問題,在此不重複敘述。
模型的檢驗
在模型的參數估計量已經得到后,可以說一個計量經濟學模型已經初步建立起來了。但是,它能否客觀揭示所研究的經濟現象中諸因素之間的關係,能否付諸應用,還要通過檢驗才能決定。一般講,計量經濟學模型必須通過四級檢驗,即經濟意義檢驗、統計學檢驗、計量經濟學檢驗和預測檢驗。
1. 經濟意義檢驗
經濟意義檢驗主要檢驗模型參數估計量在經濟意義上的合理性。主要方法是將模型參數的估計量與預先擬定的理論期望值進行比較,包括參數估計量的符號、大小、相互之間的關係,以判斷其合理性。
首先檢驗參數估計量的符號。例如,有下列煤炭行業生產模型:
煤炭產量=-108.5427+0.00067×固定資產原值+0.01527×職工人數
-0.00681×電力消耗量+0.00256×木材消耗量
在該模型中,電力消耗量前的參數估計量為負,意味著電力消耗越多,煤炭產量越低,從經濟行為上無法解釋。模型不能通過檢驗,應該找出原因重新建立模型。
如果所有參數估計量的符號正確,則要進一步檢驗參數估計量的大小。例如,有下列煤炭企業生產函數模型:
Ln(煤炭產量) = 2.69+1.85Ln(固走資產原值)+0.51Ln(職工人數)
因為該模型是一個對數線性模型,所以在該模型中,固定資產原值前的參數的經濟意義是明確的,即固定資產原值的產出彈性;表示當固定資產原值增加1%時煤炭產量增加的百分數。根據產出彈性的概念,該參數估計量應該是0與1之間的一個數,模型中的參數估計量雖然符號正確,但是數值範圍與理論期望值不符,不能通過檢驗。應該找出原因重新建立模型。
即使模型參數估計量的符號正確、數值範圍適當,仍然不能說已經通過經濟意義檢驗,還要對參數之間的關係進行檢驗。例如,有下列職工家庭日用品需求模型:
Ln(人均購買日用品支出額)= -3.69+1.20Ln(人均收入)一6.40Ln(日用品類價格)
該模型也是一個對數線性模型,所以在該模型中,人均收入和日用品類價格前的參數的經濟意義是明確的,即是它們各自的需求彈性。該二參數估計量的符號是正確的,數值範圍大體適當。但是根據經濟意義,二參數估計量之和應該在1左右,因為當收入增長1%、價格增長1%時,人均購買日用品支出額也應該增長1%左右。顯然該模型的參數估計量不能通過檢驗。應該找出原因重新建立模型。
只有當模型中的參數估計量通過所有經濟意義的檢驗,方可進行下一步檢驗。模型參數估計量的經濟意義檢驗是一項最基本的檢驗,經濟意義不合理,不管其他方面的質量多麼高,模型也是沒有實際價值的。
2. 統計檢驗
統計檢驗是由統計理論決定的,目的在於檢驗模型的統計學性質。通常最廣泛應用的統計檢驗準則有擬合優度檢驗、變數和方程的顯著性檢驗等。
3. 計量經濟學檢驗
計量經濟學檢驗是由計量經濟學理論決定的,目的在於檢驗模型的計量經濟學性質。通常最主要的檢驗準則有隨機誤差項的序列相關檢驗和異方差性檢驗,解釋變數的多重共線性檢驗等。
4. 模型預測檢驗
預測檢驗主要檢驗模型參數估計量的穩定性以及相對樣本容量變化時的靈敏度,確定所建立的模型是否可以用於樣本觀測值以外的範圍,即模型的所謂超樣本特性。具體檢驗方法為:(1)利用擴大了的樣本重新估計模型參數,將新的估計值與原來的估計值進行比較,並檢驗二者之間差距的顯著性;(2)將所建立的模型用於樣本以外某一時期的實際預測,並將該預測值與實際觀測值進行比較,並檢驗二者之間差距的顯著性。
經歷並通過了上述步驟的檢驗后,可以說已經建立了所需要的計量經濟學模型,可以將它應用於預定的目的。
計量經濟學模型應用的四個主要方面:
結構分析是對經濟現象中變數之間相互關係的研究。它研究的是當一個變數或幾個變數發生變化時會對其它變數以至經濟系統產生什麼樣的影響。結構分析採用的主要方法是彈性分析,乘數分析和比較靜力分析.
(1)彈性,是經濟學中的一個重要概念,是某一變數的相對變化引起另一變數的相對變化的度量,即變數的變化率之比.
(2)乘數,也是經濟學中的一個重要概念,是某一變數的絕對變化引起另一變數的絕對變化的度量,即變數的變化量之比,也稱倍數.
(3)比較靜力分析,是比較經濟系統的不同平衡位置之間的聯繫,探索經濟系統從一個平衡位置到另一個平衡位置時變數的變化,研究經濟系統中某一個變數或參數的變化對另外變數或參數的影響.
計量經濟學模型,是從經濟預測,特別是短期預測而發展起來的.50年代與60年代的成功應用.70年代以來人們對計量經濟學模型預測功能的置疑.(沒能對1973,1979年石油危機進行預測和分析.)計量經濟學模型與其它經濟數學模型相結合,是一個發展方向.
政策評價是指從許多不同的經濟政策中選擇較好的政策予以實行,或者說是研究不同的經濟政策對經濟目標所產生的影響的差異. 計量經濟學模型與計算機技術相結合,可以建立"經濟政策實驗室".計量經濟學模型用於政策評價,主要有三種方法:
(1)工具---目標法:給定目標變數的預期值,即我們希望達到的目標,通過求解模型,得到政策變數值.
(2)政策模擬:即將不同的政策代入模型,計算各自的目標值,然後比較,決定政策的取捨.
(3)最優控制方法:將計量經濟學模型與最優化方法結合起來,選擇使得目標最優的政策或政策組合.
檢驗與發展經濟理論
(1).檢驗理論:按照某種理論去建立模型,然後用表現已經發生的經濟活動的樣本數據去擬合,如果擬合很好,則這種理論得到了檢驗.
(2).發現和發展理論:用表現已經發生的經濟活動的樣本數據去擬合各種模型,擬合得最好的模型所表現出來的
數量關係,則是經濟活動所遵循的經濟規律,即理論,這就是發現和發展理論.
從上述建立計量經濟學模型的步驟中,不難看出,任何一項計量經濟學研究、任何一個計量經濟學模型賴以成功的要素應該有三個:理論、方法和數據。
計量經濟模型
數據,反映研究對象的活動水平、相互間聯繫以及外部環境的數據,或更廣義講是信息,是計量經濟學研究的原料。這三方面缺一不可。
一般情況下,在計量經濟學研究中,方法的研究是人們關注的重點,方法的水平往往成為衡量一項研究成果水平的主要依據。這是正常的。計量經濟學理論方法的研究是計量經濟學研究工作者義不容辭的義務。但是,不能因此而忽視對經濟學理論的探討,一個不懂得經濟學理論、不了解經濟行為的人,是無法從事計量經濟學研究工作的,是不可能建立起一個哪怕是極其簡單的計量經濟學模型的。所以,計量經濟學家首先應該是一個經濟學家。相比之下,人們對數據,尤其是數據質量問題的重視更顯不足,在申請一項研究項目或評審一項研究成果時,對數據的可得性、可用性、可靠性缺乏認真的推敲;在研究過程中出現問題時,較少從數據質量方面去找原因。而實際情況是,數據已經成為制約計量經濟學發展的重要問題。