书签 分享 收藏 举报 版权申诉 / 33

类型潘省初计量经济学第3版ets9.pptx

  • 文档编号:2316146
  • 上传时间:2024-07-10
  • 格式:PPTX
  • 页数:33
  • 大小:166.44KB
  • 配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    潘省初 计量 经济学 ets9
    资源描述:

    1、第九章 面板数据模型第一节第一节 面板数据和面板数据模型面板数据和面板数据模型 混合数据(混合数据(pooled data)是将横截面数据和时间)是将横截面数据和时间序列数据结合在一起的数据。序列数据结合在一起的数据。我们在第一章中曾介绍,横截面数据模型使用同一时点不同个体(entity)的观测值,数据可来自不同地区、公司、人员或其它个体;时间序列数据则是跨越不同时期的同一地区、同一公司、同一个人或其它同一个体的数据。横截面时间序列混合数据则包含不同横截面个体不同时期的数据,或者说,混合数据包含既跨越时间又跨越空间的数据。如果混合数据包含的观测值来自同一批地区、公如果混合数据包含的观测值来自同

    2、一批地区、公司、人员或其它横截面个体的不同时期数据,则此司、人员或其它横截面个体的不同时期数据,则此类混合数据称为面板数据类混合数据称为面板数据(panel data)。面板数据通常比非面板混合数据更有用,这是因为面板数据中的地区、公司、人员等横截面个体在各时期中一直保持不变,这使得我们更易于对随着时间的推移所发生的变动进行比较。我们将基于面板数据的回归模型称为面板数据模面板数据模型型(panel data model)。面板数据模型正在得到日益广泛的应用,文献也很多。限于篇幅,我们在这里只能做一个入门性的介绍。需要深入研究的读者,请参阅有关参考文献。Baltagi,B.H.(2001),Ec

    3、onometric Analysis of Panel data,(Wiley:Chichester)Hsiao C.(2003),Analysis of Panel Data,2nd Edition,(Cambridge University Press)影印版由北京大学出版社出版,2005 本章中,我们将用一个贯穿始终的例子来说明估计本章中,我们将用一个贯穿始终的例子来说明估计面板数据模型的各种方法。我们的数据来自以下面板数据模型的各种方法。我们的数据来自以下4个产个产业:业:产业产业1:钢铁;:钢铁;产业产业2:橡胶、塑料;:橡胶、塑料;产业产业3:石制品、陶瓷制品和玻璃制品;:石制品、

    4、陶瓷制品和玻璃制品;产业产业4:纺织:纺织模型中用到的变量是:模型中用到的变量是:Yit=i产业第产业第t年出口额,单位:百万美元,不变价年出口额,单位:百万美元,不变价 EMPit=i产业第产业第t年就业人数,单位:千人年就业人数,单位:千人 OTMit=i产业第产业第t年平均每周加班小时数年平均每周加班小时数 我们收集了上述我们收集了上述4个产业这个产业这3个变量个变量19802000各各年的数据。事实上,对于这年的数据。事实上,对于这3个变量中的每一个,都个变量中的每一个,都有有84个观测值(个观测值(4个产业乘以个产业乘以21年)。由于在每个时年)。由于在每个时期(每一年)都是这期(每

    5、一年)都是这4个产业,因此这些混合数据是个产业,因此这些混合数据是面板数据,如表面板数据,如表91所示。所示。我们可以通过分别运行我们可以通过分别运行4个回归来分析这些数据,个回归来分析这些数据,每个产业一个回归:每个产业一个回归:101121123425223673833491041144(9.1)(9.2)(9.3)(9.4)ttttttttttttttttYEMPOTMuYEMPOTMuYEMPOTMuYEMPOTMu 使用表使用表91的数据估计(的数据估计(9.1)()(9.4),由于每),由于每个产业有个产业有21年的数据,因此每个回归中观测值个数都年的数据,因此每个回归中观测值个数

    6、都是是21。这种分别对这种分别对4个产业进行回归的缺点在于可能错失个产业进行回归的缺点在于可能错失包含在混合数据集中的那种一个产业影响另一个产业包含在混合数据集中的那种一个产业影响另一个产业的信息。换句话说,一个产业的数据中可能包含有对的信息。换句话说,一个产业的数据中可能包含有对于估计其它某个产业的回归系数有价值的信息,而这于估计其它某个产业的回归系数有价值的信息,而这种分别估计每个产业方程的做法无法利用这些信息,种分别估计每个产业方程的做法无法利用这些信息,这意味着估计值不够准确。这意味着估计值不够准确。如果我们能够将如果我们能够将4个产业的数据结合在一起,我们个产业的数据结合在一起,我们

    7、的样本规模就会增大,从而可以使用所有可获得的信的样本规模就会增大,从而可以使用所有可获得的信息估计系数。息估计系数。因此,我们需要讨论那些允许我们使用混合数据因此,我们需要讨论那些允许我们使用混合数据的全部信息的估计技术,将跨时间跨空间的数据结合的全部信息的估计技术,将跨时间跨空间的数据结合在一起,而不是分别进行时间序列和横截面数据的回在一起,而不是分别进行时间序列和横截面数据的回归。归。要做到这一点,最简单的方法是,假定截距和斜率要做到这一点,最简单的方法是,假定截距和斜率对于所有产业和所有时期都是一样的,进行下面的回对于所有产业和所有时期都是一样的,进行下面的回归:归:0121,2,3,4

    8、(9.5)1980,1981,.2000ititititYEMPOTMuit 这里每个变量的观测值个数都是这里每个变量的观测值个数都是84。我们用表。我们用表91中全部数据估计此方程,结果如下:中全部数据估计此方程,结果如下:2214,040.10 86.743168.47:(4.34)(39.87)(4.33)0.952,675,700,466itititYEMPOTMtRe 这种方法的致命缺陷是,估计出来的系数只有在这种方法的致命缺陷是,估计出来的系数只有在我们前面关于截距和斜率对于所有产业和所有时期我们前面关于截距和斜率对于所有产业和所有时期都是同样的值的假设成立的情况下才有用,实际情都

    9、是同样的值的假设成立的情况下才有用,实际情况当然不是如此,比如说,很难想象每个时期中每况当然不是如此,比如说,很难想象每个时期中每个产业的就业人数与其出口额之间的关系都相同,个产业的就业人数与其出口额之间的关系都相同,增加增加1000名工人对不同产业出口额的影响应当是不名工人对不同产业出口额的影响应当是不同的。同的。因此,采用模型(因此,采用模型(9.5)是不合适的,我们下面)是不合适的,我们下面讨论可用于面板数据模型的其它估计方法。讨论可用于面板数据模型的其它估计方法。*第二节 表面不相关回归 泽尔纳(Zellner)提出的表面不相关回归(Seemingly unrelated regres

    10、sion,SUR)是一种可供选择的分析面板数据的方法。表面不相关回归是一组似乎不相关但实际上相关的回归方程。表面不相关回归方程看上去不相关是因为它们类似于方程(9.1)(9.4)。在前面说到可以分别对它们运行四个回归时,我们事实上有一个冒失而错误的假设:各产业互不相干,因而我们可以分别估计每一个回归方程。回到方程(9.1)(9.4):101121123425223673833491041144(9.1)(9.2)(9.3)(9.4)ttttttttttttttttYEMPOTMuYEMPOTMuYEMPOTMuYEMPOTMu 在表面不相关回归中,各个回归之间实际上确实有关联。表面不相关回归容

    11、许各个回归方程的扰动项之间存在跨方程相关,如上面四个方程中的诸u在任何一个时期中不必相互独立,即不同方程的扰动项之间可以存在同期相关。这样,SUR估计程序就可以使用扰动项的相关来改善估计值。各个回归之间任何的相关都是有价值的信息,它可能是告诉我们某时期中发生了某些不止影响一个产业的变化或事件,这一变化并没有被任何一个自变量捕捉到,而只能反映在扰动项中。SUR程序用此信息来改善系数估计值。事实上,GLS法被应用来利用这种扰动项中跨横截面个体的相关。具体来说,在SUR模型中,各个方程的扰动项在时间上是独立的,但在横截面个体间相关,即,(,)0,ijitjstscov u uts 大多数计量经济分析

    12、软件都有运行SUR的命令,表面不相关回归步骤如下:1用OLS法分别估计每个方程,计算和保存回归中得到的残差;2用这些残差来估计扰动项方差和不同回归方程扰动项之间的协方差;3上一步估计的扰动项方差和协方差被用于执行广义最小二乘法,得到各方程系数的估计值。表面不相关回归得到的估计值是一致估计值。用SUR方法和表91中的数据估计方程(9.1)(9.4),结果如下:111225367.2427.45477.13:(3.76)(5.97)(1.62)0.6618,664,338ttttYEMPOTMtRe2222251,963.17 142.871704.48:(17.33)(24.43)(1.77)0

    13、.9943,356,773ttttYEMPOTMtRe 3332284479.7769.052976.12:(0.40)(3.80)(3.81)0.641.85 10ttttYEMPOTMtRe 444223596.0052.053140.84:(0.74)(11.18)(5.77)0.83531,122,367ttttYEMPOTMtRe 初看上去,这些结果似乎是分别回归的结果,但它们不是。跨产业扰动项协方差的估计值被SUR程序用来改善估计值,如前面所说的那样,这是为什么说表面不相关回归实际上是由相关的回归组成。在我们的例子中,SUR结果与四个方程的OLS结果差不多。然而,在很多情况下,表面

    14、不相关回归显著改善用最小二乘法得到得估计值。第三节第三节 固定影响模型固定影响模型 固定影响模型(Fixed effects model)将横截面个体之间的差异解释为截距不同,而斜率系数相同。它处理地区、公司、人员或其它横截面个体之间差异的思路是允许截距变动,不同的横截面个体(如我们例子中的不同产业)的截距是不同的,但每个产业的截距在各个时期则保持不变。在固定影响模型的假定下,面板数据中所有横截面数据和时间序列数据都可用于同一个回归。固定影响模型类似于上一节中所有数据简单结合在一起的混合模型(9.5)式,不同的是,这里横截面中每一个体有它自己的截距:012itiitititYEMPOTMu 固

    15、定影响模型通过使用虚拟变量的方法来解决截距固定影响模型通过使用虚拟变量的方法来解决截距变动问题。对于我们的例子,有变动问题。对于我们的例子,有4个产业部门,我们个产业部门,我们应当设应当设3个虚拟变量,因为设个虚拟变量,因为设3个就可以区分个就可以区分4个产业个产业的截距,并且,如果设的截距,并且,如果设4个虚拟变量的话,我们会掉个虚拟变量的话,我们会掉进所谓进所谓“虚拟变量陷阱虚拟变量陷阱”,而造成完全的多重共线性。,而造成完全的多重共线性。在固定影响模型中,我们有另一种避开虚拟变量在固定影响模型中,我们有另一种避开虚拟变量陷阱的方法,就是在模型中去掉常数项陷阱的方法,就是在模型中去掉常数项

    16、 ,然后为,然后为每个产业设一个虚拟变量:每个产业设一个虚拟变量:D11 观测值来自产业观测值来自产业1;0 其它产业其它产业 D21 观测值来自产业观测值来自产业2;0 其它产业其它产业 D31 观测值来自产业观测值来自产业3;0 其它产业其它产业 D41 观测值来自产业观测值来自产业4;0 其它产业其它产业0 可写出本章例子的固定影响模型如下:4个产业的截距项分别为 产业1:3 产业2:4 产业3:5 产业4:6 回归结果如下:1231425364(9.6)ititititYEMPOTMDDDDu 从结果中看到从结果中看到R2很高,对于固定影响模型来说,通很高,对于固定影响模型来说,通常如此。这是因为各截距项虚拟变量捕捉了横截面个常如此。这是因为各截距项虚拟变量捕捉了横截面个体之间的差异。固定影响模型的高体之间的差异。固定影响模型的高R2会造成一种虚假会造成一种虚假的表象,但实际并不象的表象,但实际并不象R2的值所展示的那么好。回归的值所展示的那么好。回归结果中没有给出各虚拟变量系数的结果中没有给出各虚拟变量系数的t值或标准误差,值或标准误差,这是因为这是因为EViews软件不报告

    展开阅读全文
    提示  兔兜文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:潘省初计量经济学第3版ets9.pptx
    链接地址:https://www.tudouwenku.com/doc/2316146.html

    若发现您的权益受到侵害,请立即联系客服,我们会尽快为您处理!

    copyright@2008-2024 兔兜文库 版权所有

    鲁公网安备37072502000182号  ICP备案号:鲁ICP备2021021588号-1  百度保障

    兔兜文库
    收起
    展开