面板數據

面板數據

面板數據,即Panel Data,也叫“平行數據”,是指在時間序列上取多個截面,在這些截面上同時選取樣本觀測值所構成的樣本數據。或者說他是一個m*n的數據矩陣,記載的是n個時間節點上,m個對象的某一數據指標。

概念


其有時間序列和截面兩個維度,當這類數據按兩個維度排列時,是排在一個平面上,與只有一個維度的數據排在一條線上有著明顯的不同,整個表格像是一個面板,所以把panel data譯作“面板數據”。但是,如果從其內在含義上講,把panel data譯為“時間序列—截面數據”更能揭示這類數據的本質上的特點。也有譯作“平行數據”或“TS-CS數據(Time Series - Cross Section)”。

舉例


1如

城市名:北京、上海、重慶、天津的GDP分別為10、11、9、8(單位億元)。這就是截面數據,在一個時間點處切開,看各個城市的不同就是截面數據。
如:2000、2001、2002、2003、2004各年的北京市GDP分別為8、9、10、11、12(單位億元)。這就是時間序列,選一個城市,看各個樣本時間點的不同就是時間序列。

2如

2000、2001、2002、2003、2004各年中國所有直轄市的GDP分別為:
北京市分別為8、9、10、11、12;
上海市分別為9、10、11、12、13;
天津市分別為5、6、7、8、9;
重慶市分別為7、8、9、10、11(單位億元)。
這就是面板數據。
面板數據是按照英文的直譯,也有人將Panel data翻譯成綜列數據、平行數據等。由於國內沒有統一的說法,因此直接使用Panel data這種英文說法應該更準確一些。說面板數據也是比較通用的,但是面板數據並不能從名稱上反映出該種數據的實際意義,故很多研究者不願使用。

研究方法


面板數據分析方法是最近幾十年來發展起來的新的統計方法,面板數據可以克服時間序列分析受多重共線性的困擾,能夠提供更多的信息、更多的變化、更少共線性、更多的自由度和更高的估計效率,而面板數據的單位根檢驗和協整分析是當前最前沿的領域之一。
面板數據的單位根檢驗的方法主要有 Levin,Lin and CHU(2002)提出的LLC檢驗方法[5]。Im,Pesearn,Shin(2003)提出的IPS檢驗[6] , Maddala和Wu(1999),Choi(2001)提出的ADF和PP檢驗[7]等。面板數據的協整檢驗的方法主要有Pedroni[8] (1999,2004)和Kao[9](1999)提出的檢驗方法,這兩種檢驗方法的原假設均為不存在協整關係,從面板數據中得到殘差統計量進行檢驗。Luciano(2003)中運用Monte Carlo模擬[10]對協整檢驗的幾種方法進行比較,說明在T較小(大)時,Kao檢驗比Pedroni檢驗更高(低)的功效。具體面板數據單位根檢驗和協整檢驗的方法見參考文獻[5-10]。

實證分析


1.指標選取和數據來源
經濟增長:本文使用地區生產總值,以1999年為基期,根據各地區生產總值指數折算成實際,單位:億元。
能源消費:考慮到近年來我國能源消費總量中,煤炭和石油供需存在著明顯低估,而電力消費數據相當準確。因此使用電力消費更能準確反映能源消費與經濟增長之間的內在聯繫(林伯強,2003)。所以本文使用各地區電力消費量 作為能源消費量,單位:億千瓦小時。
環境污染:污染物以氣休、液體、固體形態存在,本文選取工業廢水排放量作為環境污染的量化指標,單位:萬噸。
本文採用1999-2006年全國30個省(直轄市,自治區)的地區生產總值、電力消費量 和工業廢水排放量 的數據構建面板數據集。30個省(直轄市,自治區)包括北京、天津、河北、遼寧、上海、江蘇、浙江、福建、山東、廣東、山西、內蒙古、吉林、黑龍江、安徽、江西、河南、湖北、湖南、海南、廣西、重慶、四川、貴州、雲南、陝西、西藏、甘肅、青海、寧夏、新疆,由於西藏數據不全故不包括在內。數據來源於《中國統計年鑒2000-2007》。為了消除變數間可能存在的異方差,本文先對地區生產總值、地區電力消費量和工業廢水排放量進行自然對數變換。