面板数据与Eviews操作指南
www.jiayounet.com
新浪微博:数说工作室
一、面板数据简介
二、静态面板数据及Eviews实现
(1) 静态面板数据简介 (2) EVIEWS操作
三、动态面板数据及Eviews实现
(1)动态面板数据简介 (2)Eviews操作
数说工作室 www.jiayounet.com
一、面板数据简介
信息技术的发展使得数据越来越膨胀,传统的截面数据和时间序列已经不能全面刻画经济的演变,在大数据背景下,同时分析比较横截面观察值和时间序列观察值的需求越来越大。面板数据就是指既含有截面又含有时间序列的数据,分析比较这种数据的模型就是面板数据模型。
相对于一般的回归模型,面板数据模型不仅能够更好的识别和度量单纯时间序列模型和单纯横截面数据模型所不能发现的影响因素,而且可以克服多重共线性的困扰,能够提供更多的信息、更多的变化、更高的自由度和更高的估计效率,减少共线性。因此,面板数据可以更准确地刻画更为复杂的经济行为,具有更好的理论价值和应用价值。
按照模型中是否含有滞后项,又分为静态面板数据和动态面板数据,本指南将分别简介原理和Eviews操作方法。
二、静态面板数据及Eviews实现
(1) 静态面板数据简介
一般的静态面板数据模型的一般形式如下:
𝐲𝐲𝐢𝐢𝐢𝐢=𝐂𝐂+𝐛𝐛𝐱𝐱𝐢𝐢𝐢𝐢+𝐯𝐯𝐢𝐢𝐢𝐢,𝐢𝐢=𝟏𝟏,…𝐍𝐍,𝐢𝐢=𝟏𝟏,…,𝐓𝐓 (1)
标,T表示时间序列的长度。面板数据由于同时含有了多个横截面数据,有时需要考虑不同横截面个体存在的特殊效应,其误差项被设定为:
𝐯𝐯𝐢𝐢𝐢𝐢=𝛂𝛂𝐢𝐢+𝐞𝐞𝐢𝐢𝐢𝐢 (2)
其中αi代表个体效应,反映了不同个体之间的差别。
当个体效应为固定常数时,式(1)为固定效应模型,此时每个个体截面都有不同的截距项α1、α2... αn,即其分布式与Xit是有关的,反映了该个体的固定
其中C为截距,vit为误差项,i为截面下标,N表示截面的个数,t为时间下
效应,因此固定效应模型又称为相关效应模型,严格说来,这个名字更加准确。固定效应模型的形式为:
𝐲𝐲𝐢𝐢𝐢𝐢=𝐂𝐂+𝐛𝐛𝐱𝐱𝐢𝐢𝐢𝐢+𝛂𝛂𝐢𝐢+𝐯𝐯𝐢𝐢𝐢𝐢,𝐢𝐢=𝟏𝟏,…𝐍𝐍,𝐢𝐢=𝟏𝟏,…,𝐓𝐓 (3)
用矩阵表示为:
数说工作室 www.jiayounet.com
y1y2...yn即,
10000...0α1x1e1e1...0α2x2β+2 (4) +...0...0......0...1αNxnenY=Dα+xβ+e (5)
关的,因此随机效应相应又称为非相关效应模型,随机效应模型的形式为:
当个体效应αi为随机变量时,式(5)为随机效应模型,此时其分布与Xit是无
对于这两种模型,最长采用的估计方法为虚拟变量最小二乘法和广义最小二乘法。
(2)Eviews实现 1) 录入数据
𝐲𝐲𝐢𝐢𝐢𝐢=𝐂𝐂+𝐛𝐛𝐱𝐱𝐢𝐢𝐢𝐢+𝛂𝛂𝐢𝐢+𝐯𝐯𝐢𝐢𝐢𝐢,𝐢𝐢=𝟏𝟏,…𝐍𝐍,𝐢𝐢=𝟏𝟏,…,𝐓𝐓 (6)
以A、B、C、D四家银行,2000-2010年十年的面板数据为例(变量为var1、var2):
建立新的工作文件:File—New—Workfile;
选择Dated-regular frequency,填入开始年份(start date)2000和结束年
份(start date)2010,点击OK; 右键—new object—选择pool—点击OK; = 填写Cross Section Identifiers截面名:A、B、C、D;
选择view—spreadsheet—输入变量名(注意变量名后面要带?号):var1?、
var2? 输入数据 2) 单位根检验
各个变量必须同阶平稳,否则即使最终模型显著,也可能是 “伪回归”。 在pool界面选择view—unit root test—在pool series中分别输入待检验的
变量(后面要接?号)。
Level、1st different、2nd different用来确定变量差分几阶,一般从level
零阶开始检验,到1阶、2阶。
根据变量是否有截距项、是否同时有截距和明显趋势项、都没有,来相
应选择individual intercept、individual intercept and trend、none
数说工作室 www.jiayounet.com
点击OK,出现结果,原假设是不平稳,P值小于0.05时认为变量平稳
3) 协整检验
在pool界面中选择View—cointegration test—variables中输入待检验
的变量,并选择截距情况
点击OK,出现结果,none代表“有0个协整关系”、at most1为“至
多一个协整关系”……拒绝none则意味着至少有一个协整关系。
4) 模型效应形式确定
此步中要检验模型是随机效应模型还是固定效应模型,思路是先建立随机效应模型,然后检验这种形式是否正确:
数说工作室 www.jiayounet.com
建立随机效应模型:POOL—ESTIMATE。在dependent variable中填
入因变量,在右边填入自变量,cross-section选择radom
进行Hausman随机效应检验:View—Fixed/Random Effects Testing
—Correlated Random Effects - Hausman Test。原假设是应该建立随机效应模型,如果P值小于0.05,则认为应该建立固定效应模型,否则建立随机效应模型。
5) 模型建立
如果单位根检验是同阶平稳的,协整关系存在,并确定了模型的形式(随机或固定),则可以建立正式模型。
POOL—ESTIMATE,选择自变量和因变量,并相应选择模型的形式,
如果是固定效应Fixed,还可以选择不同的加权方法,以使得结果更加显著。
数说工作室 www.jiayounet.com
三、动态面板数据及Eviews实现
(1)动态面板数据简介
在现实社会中,很多经济关系是动态的,有时需要引入滞后项去解释这些经济关系。动态面板数据模型,即面板数据模型的解释项中纳入被解释变量的滞后项,以反映动态滞后效应。但滞后项与随即误差项组成部分的个体效应相关,会造成模型的内生性偏倚,本节将重点介绍动态面板数据模型的形式和估计方法。
① 动态面板数据形式
以模型中包含滞后一起的被解释变量为例,动态面板数据的基本形式为:
𝐲𝐲𝐢𝐢𝐢𝐢=𝐚𝐚𝐲𝐲𝐢𝐢𝐢𝐢−𝟏𝟏+𝐛𝐛𝐱𝐱𝐢𝐢𝐢𝐢+𝛆𝛆𝐢𝐢𝐢𝐢, 𝛆𝛆𝐢𝐢𝐢𝐢=𝐮𝐮𝐢𝐢+𝐯𝐯𝐢𝐢𝐢𝐢 (7)
部分组成,ui为个体效应,vit为异质性冲击。从动态面板模型的形式看,右侧的滞后项会与其个体效应相关,造成内生性问题,这使得OLS估计量是有偏和不一致的估计量(Badi H.Baltagi),Arellanod等提出的基于工具变量的广义矩估计方法,可以减弱内生性,得到一致的估计量。
② 广义矩估计GMM
与静态面板数据的不同在于,解释变量引入了滞后项∑yit,其误差项也由两
数说工作室 www.jiayounet.com
== 广义矩估计的基本思想
在总体未知的情况下,参数的矩估计就是用样本矩去估计总体矩。比如,可以通过样本得到样本的两个矩:X(1)和X(2)
1n(1)XyiX(2)∑ni1并通过样本的两个矩来估计总体矩:
ˆˆ(1)ME(Y)X(1)1n2yi (8) ∑ni11n2yi (9) ∑ni11n∑yini1M(2)E(Y)2X(2)在进一步计算总体参数:
(1)ˆˆˆ(1)=ˆˆ=µME(Y)=X=σ2=M(2)+(M(1))2=X(2)+(X(1))2 (10)
这是用两个矩估计总体的两个参数,当选择的矩估计方程个数多于待估参数个数时,广义矩估计方法应运而生:
设样本的r个矩为X(i),i=1,...,r,对应的有r个总体矩M(i)(b),i=1,...,r,
为待估总体参数b的函数,且r大于待估总体参数的个数,则最小二乘矩的参数�: 估计量是使下式最小的参数估计量b
r==ˆ)=Q=(bi)== (11) (b))2 ∑(X(i)−M(=i=1===此式中,有时会希望某些矩的作用大些,此时会用到加权最小二乘法。写成
==向量形式,记X=(X(i),…,X(r))T,M=(M(i),…,M(r))T,则加权最小二乘可定义为:
Q(b)=(X−M)TS−1(X−M) (12)
其中s就是关于(X-M)的协方差阵,参数b的GMM估计就是使得Q(b)达到�。 最小的b
基于工具变量的广义矩估计
如果模型的设定正确,则存在一些为0的条件矩。模型的广义矩估计的基本思想就是用矩条件估计模型参数。
设定以下模型关系式,其中b是k*1待估参数向量:
yi=h(xi,b)+eii=1,......,n (13)
如果解释变量与随机误差不相关、且随机误差项不存在异方差和序列相关,那么存在:
n∑xε等价于
i=1jii0j1,2,,k (14)
数说工作室 www.jiayounet.com
n∑xi=1ji(yi−h(Xi,β))=0j=1,2,,k (15)
这就是一组矩条件,由样本矩条件估计模型参数b,就是一种矩估计。 当模型存在解释变量与随机误差相关时,有些矩条件就不存在了,那么需要找到一个工具变量z,使z与e无关:
cov(zi,ei)=0 (16)
定义
m(b)m(b)还可以写成
e(yi,xi;b)yi−h(xi;b)ZTe(yi,xi;b) (17)
1zie(yi,xi;b)∑ni=1zen∑1iiim1(b)1ze()mb2ii2n∑ (18) m(b)i...==...()mbk=1n∑zkieii=用矩条件m(b)=0得出的参数估计量的方法,就是工具变量法。同时方程组�。工具变量法没有改变原模型,而是的解m(b)=0,就是m(b)Tm(b)极小化时的b
在原模型的参数估计过程中用工具变量替代了随机解释变量。
③ Anderson-Hsiao估计
Anderson-Hsiao将基于工具变量的广义矩估计方法引入动态面板数据模型,其估计方法建立在式(7)一阶差分的基础上:
𝐲𝐲𝐢𝐢𝐢𝐢−𝐲𝐲𝐢𝐢𝐢𝐢−𝟏𝟏=𝐚𝐚(𝐲𝐲𝐢𝐢𝐢𝐢−𝟏𝟏−𝐲𝐲𝐢𝐢𝐢𝐢−𝟐𝟐)+𝐛𝐛(𝐱𝐱𝐢𝐢𝐢𝐢−𝐱𝐱𝐢𝐢𝐢𝐢−𝟏𝟏)+𝛆𝛆𝐢𝐢𝐢𝐢−𝛆𝛆𝐢𝐢𝐢𝐢−𝟏𝟏 (19)
出使用yit−2或差分的滞后项yit−2−yit−3作为工具变量,它们与yit−1−yit−2高度相关,但与随即误差项无关,从而消除了动态面板数据模型的偏倚问题。
④ Arellano-Bover估计
Anderson和Hsiao提出了将模型差分并引入滞后的解释变量,以解决模型的
yit−1−yit−2与随即误差εit−εit−1的相关性仍然无能为力。Anderson和Hsiao提
由于εit=ui+vit,故差分可以消除内生性造成的个体效应ui,但对等式右边
数说工作室 www.jiayounet.com
内生性问题。但当遇到非平衡面板数据时,即数据存在缺失时,一阶差分变换会损失很多数据,不能充分有效的利用信息。Arellano和Bover(1995)将“向前正交离差转换法”引入到动态面板数据模型的估计中,该方法不是用本期值减去上期值,从而将模型差分,而是用本期值减去未来s期观察值的平均值,即原模型变换为:
1Tyit−∑m1yit−mT等价于:
∀∀∀
𝐲𝐲𝐢𝐢∀𝐢𝐢=𝐚𝐚𝐲𝐲𝐢𝐢𝐢𝐢−𝟏𝟏−𝐛𝐛𝐱𝐱𝐢𝐢𝐢𝐢+𝐞𝐞𝐢𝐢𝐢𝐢 (21) 𝐓𝐓𝐲𝐲𝐢𝐢∀𝐢𝐢=𝐲𝐲𝐢𝐢𝐢𝐢−∑𝐦𝐦=𝟏𝟏𝐲𝐲𝐢𝐢𝐢𝐢−𝐦𝐦 (22)
𝐓𝐓𝟏𝟏a(yit−1T+11T1T)()y−bx−x+e−∑it−n∑it−ktT∑p2eit−p (20) itTn2Tk1其中,
该方法不仅能够有效利用数据,且在转换过程中没有用到滞后值,可以更有效的利用工具变量。
动态面板数据模型一般用Sargan检验法,原假设为模型过度约束正确,采用卡方检验χ2(p−k),其中p为工具变量的秩,k为变量个数。如果原假设通过,
====则认为模型过度约束正确,否则认为模型过度约束不正确。
=
(2)动态面板数据Eviews操作指南 1) 数据录入
注意:动态面板数据的录入方式与静态的不同!
仍以A、B、C、D四家银行,2000-2010年十年的面板数据为例(变量为var1、var2):
建立新的工作文件:File—New—Workfile;
选择Balanced Panel,填入开始年份(start date)2000,结束年份(start date)
2010,和截面数(number of cross section)4,点击OK; 建立变量:右键—new object—选择series—输入变量名var1; 输入数据 2) 建立模型
在workfile截面右键new object—选择equation—输入模型名字,比如
model1。点击OK,进入模型建立截面。
数说工作室 www.jiayounet.com
选择GMM广义矩估计方法:在method中选择GMM/DPD-Generalized
Method of Moment/Dynamic Panel Data,在sample下面出现一个选项块“Dynamic Panel Wizard”,动态面板数据的建立向导。
点击该向导,选择“下一步”
数说工作室 www.jiayounet.com
选择因变量,点击下一步
填入自变量
数说工作室 www.jiayounet.com
选择“differences”即差分法,“Orthogonal deviation”即正交离差变换法,
后者适用于缺失值较多的情况。
选择工具变量,一般选择变量的高阶滞后项作为工具变量,比如模型
Var1=a*var(-1)+bvar2
可以选择var1(-2),var2(-1)等作为工具变量。
数说工作室 www.jiayounet.com
接下来都以默认选项点击下一步,完成后回到建模截面
点击确定,得到最终的建模结果。
动态面板数据的GMM估计不具有经典的拟合优度和F统计量,而采用J统计量进行Sargan检验。
原假设是模型过度约束正确,如果Sargan检验被拒绝,则说明模型设定错误。J统计量的p值可以通过excel的CHIDIST(x,ir-v)函数来获得,其中x是j统计量的值,ir是工具变量的秩,图中为14,v为估计参数个数,本例中,估计参数有两个var(-1)和var2。Sargan检验的原假设是过度约束正确,如果检验被拒绝,则说明模型设定错误,否则正确。
因篇幅问题不能全部显示,请点此查看更多更全内容