面板数据范文

时间:2023-11-16 23:31:57

面板数据

面板数据篇1

关键词:面板数据;聚类;SAS程序

中图分类号:F832 文献标志码:A 文章编号:1673-291X(2013)26-0255-04

引言

面板数据作为时间序列数据和截面数据的结合,能够提供更多信息,因而受到学者的广泛关注。国内对面板数据的研究主要集中在计量模型,在统计方法领域的研究较少,而且在仅有的研究中,大多是关于理论和思路的介绍,并没有相关实践操作的说明,阻碍了面板数据的推广和发展。国内已有面板数据聚类相关的理论研究,但实际操作过程不明晰,因此,本文拟在多指标面板数据聚类理论的基础上,给出具体的SAS程序。

一、多指标面板数据聚类介绍

(一)样本间距离的定义

面板数据包含样本、时间和指标3个维度的信息,为充分利用面板数据信息,分别用全时绝对量、全时增长速度和全时变异系数定义样本间距离。

全时变异系数距离dij(VCED):

其中α、β、γ分别表示3种距离的权重。综合距离dij(CED)是全时绝对量距离、全时增长速度距离和全时变异系数距离的加权平均。

(二)类间距离的定义

多指标面板数据,类离差平方和与总离差平方和表示如下:

其中,Wlt为类内离差平方和,W为总离差平方和,α、β、γ相加等于1,其仍分别表示3种距离的权重。

二、多指标面板数据聚类的SAS实现程序

以全国31省市的城市化水平为例,说明以上聚类过程的SAS实现程序,用SAS程序实现面板数据聚类前,首先应将需要的数据导入SAS系统中。

(一)数据导入

data语句用来指定要建立数据集的名称,此处建立了名为“yssj”的数据集,存储读入的原始数据;input选项用来指定需要导入数据的变量名,数值型变量的变量属性可以省略,字符型变量后需用“$”符号加以识别,此处pro变量后边的$符号表明此变量为字符型变量;label选项用于设定变量的标签;cards选项用于读入数据,此处读入的数据以时间、省份和x1-x6为列变量,以时间变量为标准进行升序排列。

(二)数据标准化

为消除指标间量纲的影响,需对数据进行标准化处理,数据标准化程序如下:

ods listing exclude all;ods html file="E:\标准化数据.xls";proc standard data=yssj out= zyssj mean=0 std=1;var x1-x6;run;proc print data=zyssj;run;ods html close;ods listing exclude none;

ods语句控制程序输出结果的存放位置和文件名称;proc standard表示执行数据标准化过程,data语句指定需要进行标准化的数据集,mean和std 语句分别表明标准化数据后的均值和方差,此处表明对数据进行0-1标准化,out语句指定标准化数据的输出数据集,var语句指定需要进行标准化的变量;print过程表示打印输出数据集,此处打印输出的结果存入E盘中的“标准化数据”表格中。

(三)全时绝对量距离的计算

为便于计算地区间距离,需变换数据排列方式,将地区变为列变量。通过数据变换,则任意两列相减,可得到相应两个地区的距离。

Data tzyssj;Input t var $ a1-a31;Label t=”时间” var=”变量” a1="北京" " …… a31="新疆";cards;

;Run;

%macro dif; data aqed(drop =a1-a31);set tzyssj;%do i=1 %to 30;%do j=%eval(&i.) %to 31;d&i.&j.=(a&i.-a&j.)*(a&i.-a&j.); %end;%end;run; %mend dif; %dif

ods listing exclude all;ods html file="E:\全时绝对距离求和.xls";proc means data= aqed sum;

var d11-d19 …… d3031; output out=total;ods html close;ods listing exclude none;

data数据步表示将经过变换后的标准化数据输入数据集tzyssj中,程序与上文中原始数据的输入相似,仅是读入数据的排列方式发生了变化;macro dif 过程用于计算31地区中两两地区间的距离,地区i和地区j间的距离用变量dij表示,%do用于控制计算31地区两两间距离的循环;d&i.&j.=(a&i.-a&j.)*(a&i.-a&j.)为地区间欧式距离的计算公式,此过程计算得到了地区间不同年份和不同指标的距离,生成465个变量;means过程用于地区间距离的汇总,var表示用于求和的变量,即上一步生成的465个变量,并将输出结果导出为excel格式,ods语句控制输出结果的存放位置和形式。

(四)全时增长速度距离的计算

在计算全时增长速度距离之前,应构造指标增长速度,分别构造两个矩阵a、b,a矩阵包括1995—2011年X1-X5和1995—2010年X6的数据,b矩阵包括1996—2011年X1 和1995—2011年 X2-X6的数据,a、b矩阵的对比如表1。两个矩阵相减,再除以a矩阵中对应的数据,即为指标增长速度矩阵。

iml过程表示矩阵运算,此处通过矩阵运算将数据分为两个矩阵,然后通过矩阵相减,构造增长速度的原始数据;use语句表示所使用的数据集,此处以标准化后的原始数据为基础,将数据转变为矩阵,read语句实现了这种转换,第一个read语句将tzyssj数据集中的1-101个观测的a1-a31的变量值读入s0矩阵,第二个read语句将tzyssj数据集中的2-102个观测的a1-a31的变量值读入s1矩阵,计算后的结果存入ds数据集中;两个矩阵相减再相除后,形成后一期对前一期的增长速度,对于同一变量来说,后一期对前一期的增长速度即为指标增长速度,但在相邻两个指标的节点处,后一期对前一期的增长速度没有实际意义,因此需要剔除此类数据,为便于标识此类型数据,对ds数据集中的数据加标识变量,其后的data数据步既是对ds数据集添加标识变量的过程,并为自动定义的变量名定义标签,where语句用于筛选符合条件的数据;得到增长速度的原始数据后,其后的全时增长速度距离的运行过程与全时绝对距离运行过程相似。

(五)全时变异系数距离的计算

全时变异系数距离是建立在地区指标变异系数的基础之上的,因此应首先构造变异系数的原始数据,为方便变异系数的计算,需要以时间为变量,变换数据排列方式,程序如下:

data数据步分别以地区、指标、编号和t1-t17为变量导入变异系数分析的原始数据,为了后续变异系数的计算,导入的数据应以“编号”为标志变量,进行升序排列,或者导入数据后,通过proc sort过程对编号进行排序;ods语句表示将计算得到的变异系数数据保存在E盘中的“变异原始数据”的表格中;means过程实现了地区指标变异系数的计算,计算思路如下:通过以时间为变量的排列方式,可以实现分年份计算变异系数,执行变异系数计算时,通过设定分类变量order,实现分地区计算变异系数的目的,最终计算得到全国31地区1995—2011年的指标变异系数。得到各地区指标的变异系数后,全时变异系数距离的运行过程与全时绝对距离的运算程序相似,具体程序如下:

本文认为,3种聚类的重要程度相同,因此3种距离的简均值即为综合距离。将31个地区两两之间的综合距离整理成31×31的矩阵形式,然后执行以下程序:

首先通过data数据步将31×31的综合距离矩阵导入jljz数据集中,然后执行cluster过程,由于数据集为距离矩阵,而非聚类的原始数据,因此应在data语句的选项中注明data数据集的类型为距离(distance),其余过程与正常聚类过程相同,method用于指定类间距离的定义方式,outtree指定聚类结果的输出数据集,var语句指定分析变量,id语句指定需要聚类的对象;tree过程用于绘制聚类结果图形。

(七)聚类结果

通过以上面板数据的SAS程序,全国31省市城市化水平的聚类结果如图1,表现了良好的聚类性状。

三、总结

面板数据篇2

关键词:C-D生产函数;面板模型;技术参数;产出弹性

一、文献综述

Cobb和Douglas(1928)在对生产理论的研究中提出了Cobb-Douglas生产函数(简记为C-D生产函数)。Douglas(1976) 对C-D生产函数进行了再研究,分析了C-D的历史、检验以及一些新的经验价值。在国外学者研究基础上,国内也有很多学者对C-D生产函数进行了研究。穆东(1995)提出了一种更符合生产函数定义的C-D生产函数的DEA估计方法。崔永伟等(2012)总结了生产函数形式选择的理论与实证标准。从上述分析中,可知C-D生产函数有很强的理论价值和实际价值。对其进行深入的理论研究和应用,对于生产理论的发展以及用其更好的解决现实问题具有重大的意义。在这些研究者所研究的基础上,本文研究的目标是实现C-D生产函数与面板数据的完美融合。

二、理论模型

三、样本数据说明

本文选择中部地区的十个省份作为截面个体。这十个省份分别是:山西省、内蒙古自治区、吉林省、黑龙江省、安徽省、江西省、河南省、湖北省、湖南省和海南省。从《新中国六十年统计年鉴》可搜集到1988年-2007年我国中部地区十个省份以现价表示的GDP、GDP指数、总就业人员数。根据GDP和GDP指数可以构造出GDP平减指数;然后用现价表示的GDP除以GDP平减指数可以得到以1988年价格表示的实际GDP(经济总体产出Y)。用总就业人员数来表示经济总体中的劳动投入L。孙辉等(2010)对我国各省资本存量进行了估计,可得我国1988年-2007年中部十省经济总体的资本存量K。因而获得了中部十省的实际产出Y、资本存量K,和劳动投入L的数据。

四、经济总体面板模型计量分析

依据第二部分对柯布道格拉斯生产函数的扩展分析,对我国中部十个省经济总体构建了如等式(2)所示的经济总体面板模型。

由上表可知,大多数常数项系数估计值的P值大于0.05,因而技术因素对产出的影响并不是显著的。从资本产出弹性的估计来看,在8%的显著性水平下,1997年-2000年的系数估计值不显著,其他的均为显著。从经济意义来说,资本产出弹性估计值的范围为0.384~0.627,是符合柯布-道格拉斯生产函数理论的。从劳动产出弹性的估计来看,所有参数估计值在4%的显著性水平下都是显著的。从经济意义来说,劳动产出弹性的估计范围为0.405~0.533,是符合柯布-道格拉斯生产函数理论的。另外,判定系数为0.96,调整判定系数为0.95,F统计量的P值为0.00,说明模型的整体估计效果是比较理想的。

五、结论

本文在已有研究的基础上,将C-D生产函数与面板数据进行了较为完美的结合。考虑了C-D生产函数在不同时期可能存在的技术参数、资本劳动弹性和产出弹性的不同,对C-D生产函数进行了扩展分析。在此基础上研究了我国中部十省经济总体的生产问题。经济总体面板模型估计在统计上是比较令人满意的。资本产出弹性估计值的范围为0.384~0.627,劳动产出弹性的估计范围为0.405~0.533,是符合柯布-道格拉斯生产函数理论的。

参考文献:

[1]Cobb C W, Douglas P H.A theory of production[J].American Economic Review,1928,18:39-65.

[2]Paul H. Douglas. The Cobb-Douglas Production Function Once Again [J].Journal of Political Economy, 1976, 84(5):903-916.

[3]穆东.阶段C―D前沿生产函数的DEA估计[J].系统工程,1995,05:48-51.

[4]崔永伟,杜聪慧.生产函数理论与函数形式的选择研究[J].中国管理科学,2012,S1:67-73

[5]孙辉,支大林,李宏瑾.对中国各省资本存量的估计及典型性事实:1978~2008[J].广东金融学院学报,2010,03:103-116+129.

[6]威廉.H.格林.计量经济分析[M].张成思译.北京:中国人民大学出版社,2011: 175-238.

[7]靳云汇,金赛男等.高级计量经济学.下册[M].北京:北京大学出版社,2011:147-198.

面板数据篇3

面板数据同时包含了许多横截面在时间序列上的样本信息,不同于只有一个维度的纯粹横截面数据和时间序列数据,面板数据是同时有横截面和时序二维的。使用二维的面板数据相对于只使用横截面数据或时序数据,在理论上被认为有一些优点,其中一个重要的优点是面板数据被认为能够控制个体的异质性。在面板数据中,人们认为不同的横截面很可能具有异质性,这个异质性被认为是无法用已知的回归元观测的,同时异质性被假定为依横截面不同而不同,但在不同时点却是稳定的,因此可以用横截面虚拟变量来控制横截面的异质性,如果异质性是发生在不同时期的,那么则用时期虚拟变量来控制。而这些工作在只有横截面数据或时序数据时是无法完成的。

然而,实际上绝大多数时候我们并不关心这个异质性究竟是多少,我们关心的仍然是回归元参数的估计结果。使用面板数据做过实际研究的人可能会发现,使用的效应①不同,对回归元的估计结果经常有十分巨大的影响,在某个固定效应设定下回归系数为正显着,而另外一个效应则变为负显着,这种事情经常可以碰到,让人十分困惑。大多数的研究文献都将这种影响解释为控制了固定效应后的结果,因为不可观测的异质性(固定效应)很可能和回归元是相关的,在控制了这个效应后,由于变量之间的相关性,自然会对回归元的估计结果产生影响,因而使用的效应不同,估计的结果一般也就会有显着变化。

然而,这个被广泛接受的理论假说,本质上来讲是有问题的。我们认为,估计的效应不同,对应的自变量估计系数的含义也不同,而导致估计结果有显着变化的可能重要原因是由于面板数据是二维的数据,而在这两个不同维度上,以及将两个维度的信息放到一起时,样本信息所显现出来的自变量和因变量之间的相关关系可能是不同的。因此,我们这里提出另外一种异质性,即样本在不同维度上的相关关系是不同的,是异质的,这个异质性是发生在回归元的回归系数上,而不是截距项。我们试图从面板数据的横截面维度和时间序列维度的样本相关异质性角度来解释为什么使用的效应不同会使估计结果产生如此巨大的差异,而这很有可能正是由于异质性导致了在使用不同效应时,使估计的结果有显着的差异。

另外,所谓的不可观测的异质性(Unobserved Heterogeneity)在理论上被假定是无法用回归元观测的,同时,一般认为面板模型的固定效应与回归元可能是相关的,而且这个效应与回归元是否正交(相关)实际上也是判断应该使用固定效应还是随机效应的标准之一(Greene,2002;Mundlak,1978)。而所谓的不可观测的异质性,实际上至少并不是完全不可观测的,通过适当的模型设定,把固定效应再进行分解,就得到可观测的和真正不可观测的异质性,并且模型的估计将在国家效应和随机效应之间获得融合,在这点上,我们与Mundlak(1978)的结论是一致的。

面板模型的很多方法和解释通过教科书的广泛传播和人们的应用,已经形成了面板计量技术的使用者和研究者头脑中标准的理解,而这种已经在人们脑海中形成规范解释的东西则可能是较难以改变的,因此为了说明问题,我们在文中尽量使用直观的例子来进行解释,并对我们的想法给予简要而直接的证明,来加强论文的理论性。

一、横截面和时间序列,哪一个维度?一个有其他遗漏变量的例子

读者可能会对这个问题稍微感到奇隆,并回答面板数据由于是二维数据,那么其回归结果也应该同时来自于两个维度,这正是面板数据的长处,并且直觉上两个维度上的相关关系应该是一致的,这应该是个不言自明的问题。

这个回答表面上看似正确的,然而真实的答案却不是那么简单,面板数据的回归结果并不真的一定同时来自两个维度,关于哪个维度占主要的问题在面板数据的分析中是至关重要的,尤其当我们有横截面和时间序列的维度相关异质性问题时。

这里我们所说的异质性不同于传统的面板异质性。传统的面板异质性宣称异质性来自于依横截面和时点不同而变化的截距项,并通过横截面和时点的虚拟变量捕捉;而这个论点可能是武断的,异质性可能并不来自于截距项,而是来自于回归元的系数,尤其是在数据中经常有这样的现象,即自变量与因变量在横截面上的相关关系与时间序列上的相关关系是不同的②,这是我们所探讨的异质性,导致这种异质性的原因可能有很多,遗漏变量是一个可能的重要原因。另外自变量在不同维度上对因变量本身就具有不同的作用,这也是一种可能。图1为有其他变量遗漏的情况。

图1的面板数据样本具有4个截面,6个时期,数据由如下过程生成:

然而,如果是不可观测的,那么模型就会产生遗漏变量偏差。在实际面板数据模型的应用中,经常采用的步骤是先做混合回归,然后做横截面固定效应回归,然后做时间固定效应回归(或与横截面固定效应同时使用)。如果看图1,很可能研究者就会采用横截面固定效应或者双固定效应,而在上面的案例中,采用混合回归与横截面固定效应回归都会得到完全错误的结果,其中横截面固定效应的估计结果偏差最高,双固定效应的估计稍好,但是也经常产生有偏的结果,只有时期固定效应会产生最无偏有效的估计结果。

图2给出了使用各种效应得到的回归拟合线,每个回归的截距项已经取平均从而使得回归线落在样本点的中央,从图2中可以看到,不同的模型设定对估计系数产生明显的影响。很明显,只有时间固定效应得到了x与y的真实的相关关系,偏差最小;横截面固定效应则显示了x与y在时序上的相关关系,是偏差最大的估计;混合回归也基本显示了时序的信息;而双固定效应在这里凑巧也有较大的估计偏误,这是因为双固定效应的双向组内均值离差操作损失了许多有用的样本信息,并且在我们模拟中的一个相对大的干扰项方差也降低了估计的效率。

那么,为什么以上结果会发生呢?为了解决这个问题,我们需要探讨面板数据模型固定效应估计的本质。

1.横截面和时间固定效应的本质

如果我们有一个截面个体的时间序列样本y和X,我们可以对y和X做回归得到截距项α和系数向量β,这反映了样本在时序上的相关关系,如果我们把每个截面都做回归,就得到一个方程系统:

从式(5)和式(6)中,很容易发现,拟合准则对于β和α的一阶条件产生了同样的估计条件,也即是横截面固定效应估计量的估计条件:

Xβ+Dα=y (7)

这个估计量即是有一个线性约束=β的每个截面个体的时间序列回归的估计量,同时我们知道这也是横截面固定效应的估计量。因此,我们有推论1:

推论1 横截面固定效应估计本质上是在做一个有线性约束的时间序列回归,约束则是每个横截面个体具有相同的回归系数。同样,容易证明,时间固定效应估计量本质上是在做一个有线性约束的横截面回归,约束则是每个时期的横截面回归具有相同的回归系数。而回忆固定效应的算法,我们知道,横截面固定效应(时期固定效应),或者说不可观测的异质性,实际上是约束每个横截面(每个时期)的误差项的均值为0的结果,因此,固定效应,或者说不可观测的异质性实际是估计的结果而不是原因。

2.每个横截面的和总的β的关系

给定横截面个体i,我们知道该横截面的时间序列回归的估计量包含在式(10)中:

可以看到,每个截面的时序回归实际上是把估计横截面固定效应的样本按横截面分成n份,或者反过来说横截面固定效应的估计实际上是把每一个截面的时序回归的样本放到一起形成一个大样本,那么,每个截面的回归系数与固定效应的回归系数β有什么样的关系呢?

我们通过假设只有一个回归元x来给出直接的例证,若只有一个x,则对于某截面i有:

如果现 在有多于1个的回归元,并且回归元之间理论上是无关的,那么这时式(13)仍然成立,但如果回归元之间是相关的,问题就会复杂很多,不过如果使用偏回归方法,先排除其他变量的干扰,我们仍然可以得到类似的结论,我们自己所做的一些数值模拟和估计也显示了这点,细节不在这里补充。由以上的讨论,可得到推论2。

推论2 横截面固定效应估计本质上是在做一个有线性约束的时间序列回归,其估计结果等于对每一个横截面进行时序回归得到的系数的加权平均。同样的结论可以推广到时间固定效应的估计,即时间固定效应的估计结果等于每个时期横截面回归估计结果的加权平均。

现在我们知道图1和图2所示的例子中为什么使用混合效应,横截面固定效应会出现明显的偏误,而时期固定效应的结果则是正确的。因为和由于非平稳性导致在时序上两者是相关的,但是因为是随机生成的,并且和的生成过程是独立的,因此和在横截面维度上是不相关的。而使用混合回归不区分样本信息究竟来自哪个维度,它合并了时间序列和横截面二维的样本信息进行回归,因此导致的估计产生向上的偏误(因为被遗漏了),但混合回归的结果并不是偏误最严重的,因为至少在横截面方向上和是无关的;横截面固定效应估计则有最严重的偏误,因为如前所述,横截面固定效应是做一个有线性约束的时序回归,其结果等于每个截面的回归结果的加权平均,而这里和在时间序列上相关性明显,导致估计结果有很大偏误;只有时期固定效应产生了最准确的估计,因为时期固定效应做的是横截面方向的回归,而这里由于在横截面方向上和是无关的,因此即使缺失,也不会对的估计结果产生干扰,时期固定效应在以上我们所模拟的数据中是最好的估计量③。

上面的例子中所做的模拟数据是一个有着大T小N的数据集,而面板数据一般是有着大N小T的数据集,因此我们的模拟可能会由于其特定的T和N而受到质疑,而实际上,理论结果并不受到样本尺寸的明显影响。图3和图4展示了另一个有着相对大N和小T的模拟数据,其中N=6,T=3。

3.四个估计量之间的关系

前面我们说明了横截面固定效应和时间固定效应的本质,即横截面固定效应估计得到的更多是样本时间维上的相关关系,时间固定效应估计得到的更多是样本横截面维度上的相关关系;而混合效应的本质则十分容易理解,它不区分这两个维度,把所有样本当成一个维度来估计,合并了样本截面维和时间维上的信息;而双向固定效应的估计量我们知道为,下面我们要继续深入问下一个问题:混合效应、截面固定效应、时间固定效应和双向固定效应之间的关系是什么?同时,双向固定效应的本质又是什么?

由式(17),我们得到:

总之,我们有推论3。

推论3 混合效应、截面固定效应、时期固定效应以及双向固定效应的估计量有式(20)和式(21)所示的理论关系,双向固定效应估计量可以表示为其他三个估计量的(正定)矩阵加权平均形式,在只有一个自变量时,关系可简化为式(27),权重为相应估计量的自变量方差之比。

二、所谓的不可观测的异质性真的是不可观测的吗?另一个遗漏变量的例子

以上讨论的面板数据中横截面和时间序列的相关异质性是由于另外一个遗漏变量导致的,下面我们再看另外一个有着截面和时序异质的例子,见图5。

图5的虚线和实线与图1有着同样的含义,与图1不同的是,这里我们模拟的数据令x与y在截面维度上是正相关的(虚线),而在时间维度两者是负相关的(实线)。只看样本散点图,可能直接使用横截面固定效应和双向固定是合理的选择,然而,直接这样做仍然是有问题的。数据生成过程如下:

上面的数据生成过程导致了如图5所显示的横截面和时序相关异质的现象,我们还可以有其他类似数据生成过程来产生这种异质性,如式(32)⑦。

读者可能对我们的数据生成过程稍感疑惑,实际上,我们的数据生成过程有很强的经济学意义,体现了一种变量自身所有的横截面与时间序列上的效应不一致。下面用直观的例子讨论这种现象,尤其是式(30)和式(31)所示的数据生成过程出现的可能原因和经济含义。

1.相对性

2.集体行为(利益)与个体行为(利益)的不一致

3.自选择问题

自选择问题同样能够导致横截面和时序相关关系的不一致。有一个经典的关于自选择问题的案例,即医疗和健康的问题。去医院看病预期会提高人们的身体健康水平,而一个很自然的考察医院治疗效果的经验方法是比较去医院多的人与去医院少的人的健康水平,然而,如Angrist和Pischke(2008)所示,截面的比较反而表明去医院治疗意味着更差的健康水平,这意味着医院的治疗使人们的健康水平降低么?当然不是。这个问题就有着自选择和反向因果的原因,去医院看病多的人可能本来就有着较差的身体素质,这导致即使接受治疗他们也会比其他的人身体差,所以在横截面上看,医院治疗与更差的身体状况相关,然而在时序方向上看,医院的治疗还是能够提高人们的身体状况的。如果能够较好的度量个体的本身内在的身体素质,那么我们可以预期式(32)中的为负,而为正。这里我们只拿自选择问题做一个简单的例子来说明可能横截面和时序的相关异质性,实际中处理自选择问题一般采用随机分配、固定效应或DID方法。

这时,时间固定效应才是需要的。同样的结论可以推广到截面固定效应和双向固定效应的情况。因此,我们有推论4:

推论4 在面板模型的估计中,在一般的模型设定下,所谓不可观测的异质性(固定效应)并不是完全不可观测的;固定效应与回归元之间的相关是因为模型设定的遗漏变量导致的本可观测的元素被假定为不可观测而被放到了固定效应中,使得与回归元相关,是遗漏变量导致的结果;我们认为在估计固定效应时正确的模型形式应如式(34)所示的形式,在时间固定效应时加入项估计,在截面固定效应时加入项估计,在双向固定时两者都加入,否则,模型就会有遗漏解释变量的问题,研究者会面临着损失重要的解释变量的危险。

前面我们只是在有一个解释变量的情况下做出了直觉的说明,下面以时间固定效应为例,我们给出推论4的一般情况下的证明。

传统的时间固定效应模型如下:

另外,上面的讨论是用时期固定效应的情况做出的,而同样的结论可以推广到横截面固定效应和双向固定效应的情况,这里不再补充。

三、结论

面板数据模型的研究和应用,最早可追溯到Kuh(1959)、Mundlak(1961)、Hock(1962)、Balestra和Nerlove(1966)、Wallace和Hussain(1969)等,他们发展了最早的面板模型组间估计、组内估计、GLS及ML估计等方法。其中,早在Kuh(1959)的论文中就已经用组间估计发现了横截面样本与时间序列样本可能存在的相关关系不一致的问题,Kuh将这个不一致性解释为时序样本反应了变量的短期关系,而截面样本反应的是均衡的长期关系。但在之后的研究中,横截面维度与时序维度的样本相关异质问题却一直被忽略了,经典的面板模型设定成为标准的形式,即暗含假设自变量与因变量在不同维度的相关关系是同质的。在Balestra和Nerlove(1966)、Wallace和Hussain(1969)之后,研究者们更多地关心面板的估计是应该用组内估计还是考虑协方差矩阵加权的GLS估计,是用固定效应估计还是随机效应估计。其中,Maddala(1971)已经注意到,固定效应估计量的使用导致模型消除了组间样本的信息,而如果组间样本的变异程度相对于样本总的变异程度很大的话,模型是不够恰当的,他损失了大量的样本信息,但Maddala的对策则是转向了随机效应的研究。而随机效应的问题是其效应的随机性假定常常是不成立的,其估计方法忽视了可能存在的效应与解释变量之间的相关导致结果可能有偏误。Mundlak(1978)则通过再将固定效应做辅助回归进行分解,得到了与本文推论4类似的结论,但是他忽视了这个表面的模型估计问题背后隐藏的横截面与时序的相关异质问题,而这是我们更关心的。

混合效应、横截面固定效应、时间固定效应以及双向固定效应,一步步地,几乎已经成为了使用面板数据模型的标准步骤。面板数据的使用者可能经常会碰到不同效应的使用对回归元的估计结果有很大的影响的情况, 这经常被解释为是因为固定效应控制了所谓的不可观测的异质性,而这个固定效应可能是跟回归元相关的,这导致了使用的效应不同,估计结果就会有变化。实际上,严格来讲,我们认为这种解释是不准确的。我们在文中证明,横截面固定效应估计实际上做的是有线性约束的时间序列回归,其估计结果是用时序上的样本信息得出的,回归系数等于每个横截面的时间序列回归系数的加权平均,而时间固定效应估计实际上做的是有线性约束的横截面回归,回归的系数等于每个时点的横截面回归的系数的加权平均;而所谓的横截面固定效应(时期固定效应),或者说不可观测的异质性,实际上是约束每个横截面(每个时期)的误差项的均值为0的结果。而双向固定效应的估计量则是混合效应、截面固定效应和时间固定效应估计量的加权平均。

因此,在使用不同的效应时估计结果经常有很大变化的原因有可能是因为在面板数据中自变量与因变量之间的相关关系在横截面维度和时间维度有本身就有显着不同导致的,我们称这种现象为面板数据的横截面维度和时间维度的相关异质,在图1和图5里我们用模拟生成的数据清晰地显示了这种现象。基于此,我们认为,在使用面板数据时,研究者需要十分清楚自己要研究的变量之间的相关关系是存在于哪个维度上的,或者说在哪个维度方向上结果才是真实的,依据逻辑和经济的理论来判断需要使用什么样的模型(14),而不是依靠固定效应是否显着的统计检验。

进一步地,本文除探讨了因为其他变量的干扰导致的横截面和时间序列的相关异质性,还讨论了变量自身就可能存在的相关异质性,并解释了三种可能的原因,即相对性,集体行为与个体行为的不一致以及自选择问题。我们展示了经典的面板模型中所谓的不可观测的异质性,实际上可能并不是完全不可观测的,只不过是由于传统的面板模型设置把本来可以观测的部分假定为无法观测而放入了固定效应中造成的,即本来可观测的项被遗漏而进入时间固定效应,项被遗漏而进入截面固定效应,而我们所熟知的固定效应与回归元之间的相关性,其实是由这个问题导致的,是遗漏变量的结果,这部分结论与Mundlak(1978)基本是一致的。并且,除了遗漏和项导致固定效应与回归元之间的相关问题,(和)也不应该被遗弃,即使其加入对(-)或者说的估计没有影响,因为非常有价值的样本信息可能隐藏在其中,尤其当样本有我们所说的横截面和时序的相关异质性时。因此,我们建议研究者在做有时间固定效应的回归时,可以考虑加入项,如文中的式(35)所示,在做有截面固定效应的回归时,可以加入项(15),双向固定效应时侧两者都加入,来看看结果的差异,否则研究者在研究中可能会耐性遗漏重要的解释变量的危险。

注释:

①可以分为混合效应、截面固定效应、时期固定效应和双向固定效应。

②这里所说的不同并不是面板模型中变系数模型所说的不同,而是横截面与时序上的不同,但是各个横截面(和时序)内部的系数仍然假定为是相同的。

③有学者以“由于我们的数据生成过程中x和z均为I(1)的过程,不可避免地陷入了时间序列上的伪回归问题”为由对我们提出质疑,这里我们想说明的是:我们知道自变量和因变量的非平稳性会导致时序上的伪回归问题,但注意x和z均为自变量而不是一个自变量一个因变量,没有拿x对z做回归;并且本文讨论的是为什么在样本非平稳和遗漏变量z的情况下,时间固定效应却能得到准确的估计,而其他效应,尤其是横截面固定效应和混合回归却得到完全错误的结果。这种回归元的设定是我们故意为之从而讨论这个问题,而不是违背基本的计量经济学的常识。进一步地,如果这里是一个独立的平稳过程,那么无论哪种效应设定理论上都不会对的估计结果产生明显影响(不管是否平稳),因为这时无论是在哪个维度,与都是无关的。

(12)Mundlak主要探讨了横截面固定效应时的情况,不过本质上与时间固定效应是一样的。

(13)针对其他任何类似于这样仅在不同时期有变化的变量也一样。

面板数据篇4

[关键词]面板数据模型;聚类分析;回归分析

[中图分类号]F259 [文献标识码]A [文章编号]1005-6432(2014)10-0018-02

1 引 言

近年来,对物流与经济的回归分析大都局限于时间序列或者截面序列,采用面板数据对其进行回归分析的文献很少。[ZW(]时序数据是指时间序列数据,是同一指标按不同时间顺序记录的数据列。横截面数据是在同一时间,不同统计单位相同统计指标或者同一统计单位不同统计指标组成的数据列。面板数据是时序数据与截面数据综合起来的一种数据类型,具有三个维度的信息,一是时间维度信息,二是空间维度,也叫区域维度信息,三是指标变量维度的信息。[ZW)]而对于物流与经济的关系研究大多局限于货物周转量(代表物流)与GDP(代表经济)之间的相互关系研究。本文在前人研究的基础上,应用面板数据,采用Stata软件分析了云南物流发展的经济原因,并根据其特点,提出了发展云南现代物流的建议。

2 模型构建

2.1 理论假设

物流需求可以看成是各经济要素的函数。我们假设云南省物流需求是受各州市经济等因素的影响而决定的,而经济特征不同的地区对于物流需求不同。函数式可表示为:

Qit=f(Xit)=f(Git,Dit,Jit,Rit,…)

上式中向量集Xit表示各州市总的经济特征,可将Xit分解为分力Git、Dit、Jit、Rit等,其中Git表示i州市t年的GDP、Dit表示i州市t年的第二产业总值、Jit表示i州市t年就业人员、Rit表示i州市t年人均GDP、Qit表示i州市t年物流需求。

2.2 变量选择

本文主要从各州市物流规模、各地经济发展状况以及物流劳动力供给三个方面出发选取相关指标来研究物流与经济的关系。

(1)反映物流规模的指标

目前,相关研究普遍采用货运量与货物周转量来表征物流需求,但是,以上两种方法都存在较大的局限性,因为运输可能存在迂回运输、二次运输甚至三次运输、且运输对象有巨大差异性,因此用货运量或货物周转量来表征物流都会使其失真,对研究结果有偏歧。

国家统计局和国家标准局制定的国民经济行业分类标准:物流业属于第三产业中交通运输、仓储和邮电业。综上所述,本文认为,在分析各州市物流需求与经济的关系时,采用运输仓储及邮政总额这个指标来反映物流的需求比较合理。

(2)反映各地经济发展状况的指标

本文选取各州市生产总值和第二产业总值来表示各地区的经济发展状况。

(3)反映物流劳动力供给方面的指标

根据数据的可得性以及前人研究成果,本文采用城镇单位交通运输仓储和邮政就业人员来反映物流劳动力供给方面的情况。

2.3 回归模型估计

面板数据模型最基本的形式——个体效应模型,如下所示:

yit=xit′+αi+εit

根据变量截距α是否与解释变量x存在相关性将个体效应模型分为固定效应模型和随机效应模型。以下将应用Hausman检验来确定云南十六个州市的个体效应模型应当选用随机效应模型还是固定效应模型。Hausman检验的原假设与备择假设分别为:H统计量渐进服从于卡方分布,其中:

M=K-非时变量个数-时变量总数

因此,H统计量可以直观地告诉我们如何在随机效应和固定效应中进行选取。当无法拒绝原假设时,选用随机效应,但如果原假设被拒绝,则选择固定效应。

首先,对本文中十六州市十五年五个指标的面板数据进行平衡性检验,通过Stata中xtdescribe命令,检验结果显示该面板数据满足平衡的条件。

通过Hausman检验来确定究竟选择固定效应模型还是随机效应模型,结果如图1所示。检验结果表明,卡方统计量值为23.07,自由度为4,在95%的显著性水平下接受原假设的概率为0.0001,故应拒绝原假设选用固定效应模型及相应的估计方法。从本文的研究来看,由于是利用云南省十六州市的数据来考察云南各州市物流的发展与区域经济之间的关系,各州市之间有很大的个体差异,因此,采用固定效应模型更为合理。

3 研究结论及建议

按照以上理论假设,对四类州市[ZW(]十六州市的聚类分析参见笔者的《云南现代物流经济与空间研究》第四章第四节的研究结果。第一类州市为昆明,第二类州市为曲靖、玉溪、红河、大理、楚雄,第三类州市为昭通、文山、普洱、临沧,第四类州市为保山、西双版纳、德宏、丽江、迪庆、怒江。[ZW)]进行回归分析。得出四类州市的回归结果,并在此基础上提出了针对性的物流发展建议。

3.1 借力滇中城市群助推区域经济一体化发展

由于第一类州市就昆明一个市,因此进行一般逐步回归分析,结果如图2所示。

从图2可以看出,对于第一区域即昆明来说,通过逐步回归可知在95%的显著性水平下,对昆明来说,GDP是物流发展的最大推动因素。在其他变量不变的情况下,每增加一个单位的GDP会带给物流1.9764个单位的增量。

昆明应借力滇中城市群经济一体化的发展,充分发挥昆明在滇中城市群的增长极作用,分阶段推进滇中城市群经济一体化,从而促进昆明物流的快速发展。在一体化发展初期主要强化昆明的极核作用,不断完善交通基础设施建设;中期应注重阶段性推进一体化进程;远期要努力提高昆明的国际影响力,不断增强辐射能力和综合服务能力,并逐步由单一增长极即昆明向四极即昆明、曲靖、玉溪、楚雄四大城市增长极转变。最终实现滇中四州市经济要素无障碍流动,推动昆明国民经济的发展,从而推动物流现代化的发展。

3.2 大力发展烟草产业集群

如图3所示,对于第二区域来说,第二产业的发展对物流影响最显著。在其他变量保持不变的情况下,每增加一个单位第二产业值,会给物流带来1.2707个增量。因此可优先发展第二产业,通过第二产业的发展带动物流的发展。

第二类州市为曲靖、玉溪、红河、大理、楚雄,这五个州市在卷烟及其配套工业、钢铁、化工、有色金属、煤炭、化工、电力和冶金方面对第二产业做出了巨大的贡献,云南的第二产业的发展主要依靠这类州市。此类州市应从已有的优势产业烟草及其配套产业入手,大力发展烟草产业集群,把产业物流做强做大。

3.3 完善物流基础设施建设

如图4所示,对于第三区域来说,方程整体显著性检验F值对应的P值为0.00,说明整个方程是显著的。但GDP、人均GDP、第二产业、物流相关就业人员均不显著,因此对于这一区域来说,他们均不是推动物流发展的因素。第三类为昭通、文山、普洱、临沧,它们距昆明的空间距离较远,经济状况较差,无支柱产业,处于“尴尬”境地,发展物流较难。鉴于此,本文提出首先完善此类州市的交通基础设施,之后可考虑将此类州市的物流外包给其他三类州市,从而集中精力探寻自己的优势,当条件适合时,再发展自己的物流。

3.4 加强与东盟的外贸往来

如图5所示,对于第四类州市来说,在其他变量保持不变的情况下,每增加一个单位人均GDP会带给物流3.1968个单位的增量。故对于第四类州市来说,提高人均GDP,改善经济质量是最有效的提高其物流发展的途径。

针对第四类州市的特点,首先,可以选择区域条件优越的口岸以及一些具有较强聚集能力的口岸城市或较大规模口岸作为重点增长极,通过进一步完善口岸物流基础设施,从而优化口岸物流综合体系;另外,在中国—东盟的经济合作中,这类州市要充分发挥其通道、门户的作用,在中国—东盟经济圈中发挥自己独特的功能,扩大边境地区内外贸易的需求,拓展边境地区的生产的服务,实现边境地区经济又好又快地发展,从而促进其物流的发展。参考文献:

[1]兰草.截面、面板数据分析与Stata应用[M].武汉:武汉大学出版社,2012.

[2]Hsiao,Cheng.Analysis of Panel Data[M].New York: Cambridge University Press,2003.

[3]高秀丽,王爱虎,房兴超.广东省区域物流与区域经济增长关系的实证研究[J].工业工程,2012(1):60-65.

[4]李超锋.物流产业对广东经济增长贡献的计量分析[J].透视珠三角,2007(11):38-40.

面板数据篇5

关键词 资源丰裕度;经济增长;非线性;经济结构;政治制度

中图分类号 F061.3 文献标识码 A 文章编号 1002-2104(2013)08-0001-06 doi:10.3969/j.issn.1002-2104.2013.08.001

长期以来,经济学家们一直致力于探究与经济增长有关的诸多因素和条件,即增长的源泉问题。物质资本、人力资本、自然资源和技术进步等相继被揭示出来并置于突出的地位。然而,关于自然资源的真实影响,学术界并未达成共识。自然资源对于经济发展究竟是祝福还是诅咒?本文使用1978-2011年中国30个省市区的面板数据,试图从一个更长的时间跨度去研究资源丰裕度与经济增长之间的关系及其动态变化。

1 自然资源与经济增长的悖论

早期关于自然资源丰裕度与经济增长关系的研究大都认为,丰裕的自然资源作为一种潜在财富,可以便利地被转化为资本,为经济起飞提供了很好的支持[1-2]。时至今日,仍有很多学者在研究近代以来经济发展史的基础上,在探索经济增长和发展问题的过程中强调自然资源对经济增长起到了积极的正面效应。然而,20世纪80年代以来,许多资源丰裕的国家和地区却出现了低增长甚至发展停滞的局面,这使得学术界重新开始认识资源丰裕度和经济增长的关系[3-8]。近来,也有很多学者对上述两种假说都提出了质疑,认为资源丰裕度和经济增长并不构成一一对应的关系[9-11]。

我们感兴趣的是,中国的资源丰裕度对经济增长究竟是祝福、诅咒还是没有特定的关系?是特定时期的经济现象,还是一种普遍的带有规律性的经济机理?本文使用1978-2011年中国30个省市区的面板数据,从一个更长的时间跨度去研究资源丰裕度与经济增长之间的关系及其动态变化,希望可以弥补已有文献在这方面的空白;更进一步,我们试图从实证的角度探讨中国省级层面的自然资源对经济增长的作用机制。

2 数据、计量模型设定与检验

本文运用的数据集涵盖了中国30个省、市、自治区(重庆除外)从1978年至2011年的自然资源和主要经济数据。自然资源的衡量指标主要包括原煤、原油、天然气的产量、采掘业部门的固定资产投资等;主要经济数据包括GDP、人均GDP、人口、就业人口、固定资产投资、制造业固定资产投资、财政支出、科教文卫事业支出等。

资源丰裕度的测量是实证研究中的一个重要难题,为此,学者们引入了一系列的替代变量。比如初级产品出口占GDP的比重[4]11,初级产品部门的就业比例[12],人均耕地数量[13],能源储量[14],资源租占GDP的比重[15]等。考虑到能源资源较大的经济租及其在工业化进程中的战略性地位,我们主要选取徐康宁和韩剑[16]构建的RAI指标来衡量中国各省的资源丰裕程度,并进一步使用采掘业部门的固定资产投资占固定资产投资的比重[17]这一指标作为稳健性检验。

我国一次性能源生产和消费总量中煤炭、石油、天然气的比重大约为:75%、23%和2%。以此为依据,分别赋予三种矿产资源相应的权重。RAI指标的具体计算公式如下:

与该指标类似,中国科学院公布了一个能源产量的折算公式,其中能源产量是原煤、原油、天然气产量经热量转换之后的综合指标:能源产量(108 t)=(原煤产量×0.714 t/t)+(原油产量×1.43 t/t)+(天然气产量×1.33 t/(1 000 m3))。

考虑如下的面板计量模型:

其中下标i代表省份(i=1, 2, …, 30),t代表年份(t=1978, 1979, …, 2011),y表示经济增长的衡量指标,具体包括GDP增长率、人均GDP增长率以及分别相对应的5年移动平均的GDP增长率和人均GDP增长率;RAI表示资源丰裕度指标;X表示模型中引入的一些在长期中影响经济增长的控制变量,具体包括表1中所列的资本投入、劳动力投入以及科技投入等。β0表示常数项,β1和β2是对应的估计系数,εit是随机扰动项。此外,我们的计量模型设定中也控制了省份和年份的固定效应:provi表示各省不随时间变化的固定效应;yeart表示每年对各省都有同样影响的固定效应。

2.1 “资源祝福”还是“资源诅咒”?

利用1978年至2011年全国30个省市区的面板数据进行了检验,表1报告了利用GDP增长率来衡量经济增长情况的参数估计结果。

所有控制变量对经济增长的影响基本上都符合经济理论和直觉的判断:由于经济发展的收敛性,上一年人均GDP对经济增长有负向的影响;资本、劳动以及科技投入则在很大程度上有正向的影响。控制这些解释变量将会保证计量结果得以反映自然资源对经济增长的真实影响。

接下来我们主要关注资源丰裕度与经济增长的关系,表1中的第1-4列是使用GDP增长率作为经济增长情况考核的结果,第1、2列与第3、4列的区别在于是否控制了省份和年份固定效应。从回归的结果来看,这些省份和年份虚拟变量的系数具有联合的显著性,即各省的特定条件和全国范围内的时间趋势是不能忽略的影响因素。第3列的回归结果显示,在控制了其他可能影响经济增长的因素之后,资源丰裕度对经济增长有正向的影响且达到了5%的显著性水平。这意味着,当我们从一个尽可能长的时间跨度去考察,资源的丰裕度从整体上看为经济增长提供了正向的支持。

更进一步,我们在第4列中引入了资源丰裕度的平方项来考察资源丰裕度对经济增长可能存在的一种非线性的影响:资源丰裕度平方项的估计系数为负且达到了5%的显著性水平;此时资源丰裕度的估计系数比第3列的估计系数显著增大并且显著性也进一步增强,达到了1%的显著性水平。这意味着,平方项的引入有力地建立了资源丰裕度与经济增长之间在长期中存在的非线性关系,我们称其为动态演变。也就是说,在经济发展的初期,丰裕的自然资源作为一种潜在财富,可以便利地被转化为资本,而资本是经济发展的关键因素之一,因而丰裕的自然资源为我国各省的经济起飞提供了很好的支持。然而,随着改革开放进程的推进,我国的市场化程度不断加深,产业结构持续完善,丰裕的自然资源并不能继续维持原有的角色,反而在一定程度上制约了经济的持续快速增长。

第5、6列报告了5年移动平均的GDP增长率作为经济增长衡量指标的回归结果,这样的考核指标能在一定程度上消除经济发展的短期波动,从而能够更准确地反映一个地区的经济增长情况。结果显示,当我们使用5年移动平均的指标,估计系数的符号与第3、4列完全一致并且都通过了1%的显著性检验。

2.2 稳健性检验

虽然表1中的回归结果有力地证明了我国省级层面的资源丰裕度与经济增长之间长期中所体现出来的非线性的动态演变关系,我们仍然关心以下问题:其一、资源丰裕度的测量一直是实证研究的难题,当我们使用其他的资源丰裕度指标,上述的非线性的动态演变关系是否依然存在?其二、虽然GDP增长率是大家公认的经济增长衡量指标,但如果我们使用其他的指标来衡量我国各省的经济发展情况,会不会改变上述的研究结论?

在本部分,我们使用了不同的资源丰裕度和经济增长衡量指标来进行稳健性检验。其一,采掘业投资占比。在中国的行业统计口径下,采掘业中包括煤炭、石油、天然气、金属和非金属矿采选业等与自然资源直接关联的细分行业,这些行业的投入多少完全取决于自然资源的可得性,因此我们认为,当地采掘业的投入水平可以很大程度上反映自然资源的综合禀赋状况;其二,GDP增长率更多反映的是一个地区经济总量的增长情况,考虑人均GDP增长率则能更全面地衡量经济增长给全体居民带来的福利改善。检验结果显示,我们发现的非线性动态演变关系仍然存在,且都通过了1%的显著性检验。从系数的大小来看,这种关系甚至更为强烈。

图1以一种更为直观的方式反映了这种非线性的动态演变关系,我们称其为自然资源的库兹涅茨曲线。和收入分配状况、环境污染状况等与经济发展的关系类似,自然资源丰裕度对经济增长的影响也呈现出一种倒U型的形态。

至此,我们利用1978年至2011年我国30个省份的面板数据,对我国省级层面资源丰裕度与经济增长的关系进行了更长时间跨度内、更为全面的检验,在某种程度上解开了二者之间关系的悖论:“资源祝福”、“资源诅咒”和“资源中性”假说可能在某个特定的经济发展阶段成立,但是从长期来看二者之间存在着非线性的动态演变关系,而并非单一的线性关系。

3 “资源诅咒”的传导机制:实证检验

国内外已有很多学者就“资源诅咒”的作用机制和影响渠道进行了研究,比如要素转移效应引发了“荷兰病”[18]、外部环境恶化促使资本外流、资源开采的财富分配方式扩大了贫富差距、资源主导的产业结构制约了人力资本的积累和科技能力的提升[8]86-87等等。然而,所有关于传导机制的研究基本上都停留在经济直觉的判断或者理论模型的层面,并未得到实证的检验。在本部分,我们将从经济结构和政治制度两个方面选取中国省级层面的一系列指标来进行较为严格的计量检验。

3.1 经济结构诅咒

经济结构诅咒的主要思想是,当一个国家或地区拥有某种丰富的自然资源时,比较容易陷入依赖某种自然资源的发展路径,使其他工业或产业的发展受到冷落或排挤,这种挤出效应会对未来的经济发展带来灾难性的打击。从长期来看,经济增长的驱动因素主要有人力资本和物质资本的积累、制度改革和技术进步等。丰裕的自然资源往往会对人力资本和物质资本的投资、制度和技术创新等产生忽略,从而削弱了促进经济长期增长的动力。

我们选取普通初级中学学校数量和普通初级中学在校学生人数的变动情况来衡量该省的人力资本积累情况;用制造业部门的固定资本投资占总固定资本投资份额的增长率来观察该省的物质资本积累情况。表2报告了对经济结构诅咒假说实证检验的结果。

回归结果显示,正如我们所预计的,总人口越多,初中学校的数目越多;近年来的合并浪潮确实使得初中学校数目逐年递减;然而,在我们控制住这些因素之后,仍然发现资源丰裕度对初中学校的数目有显著的负向影响(第1列),且不存在非线性影响(第2列);第4列的估计系数证明了资源丰裕度同样减少了普通初中的在校学生数,并通过了1%的显著性检验。更进一步,第6列的回归结果表明,资源丰裕度对物质资本的积累同样存在着非线性的影响:在经济发展初期,自然资源的开发能迅速地转化为资本,并带动制造业的发展;但长期来看,过度依赖资源的发展路径实际上挤出了对经济长期持续增长至关重要的制造业部门的投资。

3.2 政治制度诅咒

经济学家们在相当长的一段时间里对所谓的政治因素、社会因素、文化因素等敬而远之,但这些因素在经济增长中却起着重要的作用。在跨国增长研究中,制度因素是各国经济增长差异的一个异常重要的解释变量。在这里,我们选取了樊纲、王小鲁、朱恒鹏从上世纪末期开始连续构建的中国市场化指数作为各省制度质量的衡量指标。该指标体系对中国各省的市场化进程进行了比较全面的比较,完全采用客观指标衡量各地区市场化改革的深度和广度,避免了主观评价。具体来说,该指标体系除了给每

个省份赋予一个总得分之外,还包括政府与市场关系、非国有经济发展、产品市场发育、要素市场发育以及中介组织发育和法律这五个分指标。

表3报告了政治制度诅咒的实证检验结果。我们对各省的市场化指数总得分以及所有5个分指标都进行了计量检验,结果显示,从长期来看,资源丰裕度对市场化指数的所有指标都有负向的影响。

第2列的估计系数证明,资源丰裕度在长期中恶化了政府与市场的关系:资源丰裕的地区更容易形成“大政府”,过多地对企业进行干预,使得市场化进程更为缓慢;同样的,由于当地丰裕的自然资源,大量的人力资本和物质资本都被投入到资源部门,非国有经济更不容易得到发展的空间;最后,第5、6列的结果显示,资源丰裕地区的中介市场(律师、会计师、行业协会等)发育度更低,法制更不健全,生产者的合法权益、知识产权、专利等更不容易得到保护,从而影响了创新活动的进行,进而不利于经济的长期发展。

4 总结与讨论

本文利用1978年至2011年我国30个省份的面板数据,对我国省级层面资源丰裕度与经济增长的关系进行了更长时间跨度内、更为全面的检验。我们的研究发现,资源丰裕度与经济增长之间存在一种非线性的动态演变关系:在经济发展的初期,丰裕的自然资源作为一种潜在财富,为我国各省的经济发展提供了很好的支持。然而,随着改革开放进程的推进,我国的市场化程度不断加深,产业结构持续完善,资源部门的扩张抑制甚至挤出了其他部门的发展,反而在一定程度上制约了经济的持续快速增长。当我们使用其他资源丰裕度和经济增长指标时,这种强烈的非线性动态演变关系仍然存在。更进一步,本文使用较为严格的计量方法对自然资源作用经济增长的机制进行了实证检验,结果显示:在长期中,①自然资源会通过降低人力资本和物质资本的投资对经济结构产生“诅咒”;②自然资源会恶化政府与市场的关系、阻碍非国有经济的发展、中介组织的发育和法律的完善等,从而对政治制度也产生“诅咒”。

当然,由于数据的可得性,本文的研究还存在一些问题。比如,与电力等其他能源部门类似,中国至今的自然资源定价并没有实现完全的市场化,政府的资源价格管理机制仍起着较大的作用。自然资源(如煤炭等)在各省之间的“调拨”、地方政府出面的“采购”或者发改委确定的定价机制(比如价格上限等)使得自然资源对生产省来说是“诅咒”,而对资源消费省则是“祝福”。

致谢:

感谢李宏彬教授和肖志杰教授在本文写作过程中的悉心指导和帮助。

参考文献(References)

[1]Habakkuk H J. American and British Technology in the Nineteenth Century: The Search for Laborsaving Inventions[M]. Cambridge, MA: Cambridge University Press, 1962: 21-28.

[2]Wright G. The Origins of American Industrial Success, 1879-1940[J]. American Economic Review, 1990, 80: 651-668.

[3]Auty R M. Industrial Policy Reform in Six Large Newly Industrializing Countries: The Resource Curse Thesis[J]. World Development, 1994, 22: 11-26.

[4]Sachs J, Warner A. Natural Resource Abundance and Economic Growth[J]. NBER Working Paper, 1995, No. 5398.

[5]Sachs J, Warner A. Fundamental Sources of Longrun Growth[J]. American Economic Review, 1997, 87: 184-188.

[6]Sachs J, Warner A. The Curse of Natural Resources[J]. European Economic Review, 2001, 45: 827-838.

[7]Papyrakis E, Gerlagh R. Resource Abundance and Economic Growth in the United States[J]. European Economic Review, 2006, 51: 1011-1039

[8]徐康宁, 王剑. 自然资源丰裕程度与经济发展水平关系的研究[J]. 经济研究, 2006, 1: 78-89. [Xu Kangning, Wang Jian. An Empirical Study of A Linkage Between Natural Resource Abundance and Economic Development[J]. Economic Research Journal, 2006, 1: 78-89.]

[9]Davis G. Learning to Love the Dutch Disease: Evidence from Mineral Economies[J]. World Development, 1995, 23: 1765-1779.

[10]Coxhea I. 国际贸易和自然资源“诅咒”:中国的增长威胁到东南亚地区的发展了吗?[J]. 经济学(季刊), 2006, 5(2): 609-634. [Coxhea I. International Trade and the Natural Resource “Curse” in Southeast Asia: Does China’s Growth Threaten Regional Development?[J]. China Economic Quarterly, 2006, 5(2): 609-634.]

[11]Lederman D, Maloney W. In Search of the Missing Resource Curse[J]. Economía, 2008, 9:1-56.

[12]Gylfason T, Herbertsson T, Zoega G. A mixed Blessing: Natural Resources and Economic Growth[J]. Macroeconomic Dynamics, 1999, 3: 204-225.

[13]Wood A, Berge K. Exporting Manufactures: Human Resources, Natural Resources and Trade Policy[J]. Journal of Development Studies, 1997, 34: 35-39.

[14]Stijns J. Natural Resource Abundance and Economic Growth Revisited[R]. San Francisco: Western Economic Association International 2001 Conference, 2001.

[15]Hamilton K, Ruta G, Tajibaeva L. Capital Accumulation and Resource Depletion: A Hartwick Rule Counterfactual[J]. World Bank Policy Research Working Paper, 2005, No. 3480.

[16]徐康宁, 韩剑. 中国区域经济的“资源诅咒”效应:地区差距的另一种解释[J]. 经济学家, 2005, 6: 96-102. [Xu Kangning, Han Jian. “Resource Curse” Effect on Regional Economy in China: Another Explanation to Regional Discrepancy[J]. Economist, 2005, 6: 96-102.]

[17]胡援成, 肖德勇. 经济发展门槛与自然资源诅咒:基于我国省际层面的面板数据实证研究[J]. 管理世界(月刊), 2007, (4): 15-23. [Hu Yuancheng, Xiao Deyong. The Threshold of Economic Growth and the Natural Resource Curse[J]. Management World (Monthly), 2007, (4): 15-23.]

[18]Matsuyama K. Agricultural Productivity, Comparative Advantage and Economic Growth[J]. Journal of Economic Theory, 1992, 58: 317-334.

Natural Resources Kuznets Curve:

An Empirical Analysis Based on Chinese Provincial Panel Data

面板数据篇6

关键词:并购;劳动力需求;面板数据;固定效应

中图分类号:F241.21 文献标识码:A 文章编号:1003-7217(2010)04-0077-05

近年来,国内外并购热潮汹涌迭起。自20世纪90年代以来,全球企业并购速度加快,西方国家掀起五次并购浪潮,大企业通过并购,其规模迅速扩大,实力不断增强。在国内,随着市场体制改革进一步深入和现代企业制度步伐加快,企业并购逐渐展开,我国也经历了三次并购浪潮。

因此,并购已成为一种重要投资方式,也引起学者们广泛关注,于是有关并购内容成为学者们重要研究课题。但国内学者主要集中于并购绩效、动机、时机研究,关于并购对劳动力需求影响研究很少涉及,不同产业公司并购对劳动力需求影响研究更是尚未涉及。进行这方面研究可以从理论上丰富并购研究内容,拓展并购研究范围。同时,并购对劳动力需求有影响前提下,它也会影响到社会就业问题,而社会就业是国家稳定的基础,是构建社会主义和谐社会的重要前提,不同产业公司并购对公司劳动力需求影响研究有助于制定合理就业政策。为此探究并购对公司劳动力需求影响具有重要理论与现实意义。

一、文献回顾

国内学者关于并购对公司劳动力需求研究很少涉及,仅有少数学者在研究并购问题时附带提及并购中的就业问题,且所持观点也不一致。如王一(2001)认为企业并购是影响我国就业的重要因素,并且他指出企业并购将有助于我国社会就业状况改善。韩峰(2002)在研究企业并购的具体目标时,指出企业并购后可以减少管理人员,如减少上层管理者、会计和人事部门工作人员等。王玉霞(2003)认为并购后造成的垄断能推动经济增长,从而有利于解决充分就业问题。干春晖(2004)在研究并购问题中的就业问题时,他指出一旦目标公司被其他公司并购,无论是出于自身经营活动需要还是出于经营战略、运作成本考虑,都必定会伴随着大量冗余人员下岗分流,也即是说企业并购后会使就业减少。薛有志(2004)认为通过纵向并购可减少在实现控制功能方面所需人员,进而节约费用,提高经济效益。

国外学者就公司并购对公司就业影响进行了深入研究,取得有益成果。国外学者有关这方面研究主要集中于美国与欧洲国家,为研究需要,将按国别进行综述,具体如下:

美国:Williamson(1963)认为纵向兼并可能导致上游企业销售人员和/或下游企业采购人员减少;Brown et al.(1988)用Michiganes1978~1984年间的大样本兼并公司数据研究控制权变化对就业的影响,得出兼并使就业略微增加的结论;Bhagat et al.(1990)通过案例研究发现:在美国,敌意收购使就业特别是白领工人的就业减少;Lichtenberg et al.(1992)采用美国制造业数据进行实证研究,结果发现兼并使就业显著减少,并且减少的大部分是中央办公人员;MeGuckin et al.(1995)使用美国的面板数据进行研究,发现被兼并行业相应增加了就业。

英国:Conyon et al.(2002)利用构建的1967~1996年间的数据库,就英国接管和兼并行为对企业就业影响进行了研究,发现企业兼并使劳动力需求减少,不同兼并类型对公司就业影响有显著差异性,相关收购和敌意收购对就业的负面影响最大;Cirma et al.(2004)通过使用英国电气行业数据,经研究发现国外接管减少就业,特别是非熟练工人的就业;Amess et al.(2007)认为管理层收购增加英国就业。

奥地利:Bellak et al.(2006)研究发现在奥地利制造行业,跨国并购与就业增长之间没有因果关系。

法国:Margolis(2006)认为在法国并购在短期对就业有负面影响。

意大利:Piscitello(2005)等发现在意大利,对比没有被并购公司而言,被国外并购方并购公司在并购后几年里增加了就业。

瑞典:Siegel et al.(2006)利用瑞典制造行业数据进行研究,发现公司并购后使就业减少。

芬兰:Lehto et al.(2008)使用芬兰公司级数据进行并购对就业影响研究,发现跨国并购使制造行业就业减少,但在非制造行业这种效果比较弱;国内并购方并购国内公司对于每种行业就业都有负面影响;国外并购方并购国内公司对建筑及其他服务行业就业有负面影响;内部重组对就业也造成负面影响,这主要是针对贸易行业而言。

Gugler et al.(2004)经过研究美国和欧洲兼并收购对劳动力需求的影响,得出结论:在美国,并购对就业不存在负面影响;但在欧洲,并购对就业造成显著负面影响(-10%)。

综上所述,国外学者在研究公司并购对公司就业影响时,有如下特点:首先,研究范围主要集中于美国与欧洲国家,或者对比研究美国与欧洲国家公司并购对公司就业的不同影响;其次,研究时大多以行业数据为样本;再次,研究结论多样化,公司并购对公司就业可以是正面影响,也可以是负面影响,两者也可能不存在影响关系;最后,国外学者在研究中区分不同并购类型对公司就业影响与公司并购对不同类型员工影响。

国外学者通过实证研究就公司并购对公司就业影响得出不同结论,根据其研究特点,他们要么选择国家为研究范围,要么选择行业为研究范围。前者我们已尝试作过相关研究,而后者可能范围略显过小,对国家制定就业政策作用不大。同时,也因为近几年我国产业结构发生很大变化,不同产业的公司并购也随之而变化,这些变化必然对社会就业产生影响,所以我们以不同产业为研究范围来研究不同产业公司并购对公司劳动力需求影响有其必要性。

二、模型构建

(一)变量选择和定义

在总结国外学者关于公司并购对公司就业影响研究基础上,根据前述国内学者关于就业的影响因素研究,借鉴Conyon(2002)的相关变量选择。

(1)因变量(公司劳动力需求人数)的度量指标。本文采用上市公司年报中披露的员工人数来衡量并

购公司劳动力需求,但因避免数据差异过大,将员工人数取其对数值(下文中总销售收入及公司职工薪酬均取其对数值),用符号ln l表示。

(2)自变量(公司并购)的度量。第一产业、第二产业、第三产业发生的并购在此采用虚拟变量,分别用符号fm、sm、tm表示,公司在并购当年其值取1,否则取O。

(3)控制变量的选择及度量。因为在公司层面上,劳动力需求调整会受到公司职工薪酬及总销售收入的影响,故将此两个变量选为控制变量。职工薪酬与总销售收入均可采用上市公司年报中披露的相关数据,分别用符号ln w与ln q来表示。

(二)模型设定和估计方法

(1)模型设定。考虑并购对劳动力需求的影响效应研究模型时,可将其看成是劳动力需求由一种最佳水平向另一种最佳水平转变。如图1所示,并购前,假设A公司劳动力需求水平为L1,B公司劳动力需求水平为L2,在时间t发生并购后,假定生产技术规模收益保持不变,且相关要素价格也不变,那么并购后的公司产量与劳动力需求水平应该等于并购前两个公司总和。但若生产技术使规模收益增加(IRTS),那么并购后的公司会通过减少总劳动力需求来获得并购前各个公司产出总和。如果最佳劳动力需求水平与并购后公司总和不同,就必然会发生劳动力调整,使之达到最佳水平。但是要调整到最佳劳动力需求水平并不能在短时间内完成,所以公司将需在迅速调整所费成本与偏离最佳劳动力需求水平时所费成本之间进行权衡,从而可构造出下面的面板数据模型:

但我们在此研究不同产业公司并购对公司・劳动力需求影响,所以将自变量分为第一产业、第二产业、第三产业三个类别,以分别探讨不同产业公司并购对公司劳动力需求的差异性影响。所构造的面板数据模型如下:

其中,lnLit:公司i在时间t雇佣的职工人数的对数;lnqit:公司i在时间t的总销售收入的对数;lnWit:公司i在时间t支付给员工的薪酬的对数;fmit,:第一产业的公司i在时间t发生并购时为1,没有发生并购时为0;smit:第二产业的公司i在时间t发生并购时为1,没有发生并购时为O;tm,:第三产业的公司i在时间t发生并购时为1,没有发生并购时为O;fi特定公司的固定效应,如公司间技术、管理水平的差异;εit:方程的误差项。i=1,2,…,N;t=1,2,…,T。

运用面板数据模型进行估计时,需要在以下三个模型间进行选择:

无个体影响不变系数模型:

经常使用协方差分析检验(analysis of covari-mace)来进行检验,但因本文的截面实体很多,时期较少,属于“宽而短”的数据,不宜采用Eviews中的Pool对象来处理,只能通过具有面板结构的工作文件(panel worldile)进行分析,但因利用面板结构的工作文件只宜进行变截距面板数据模型与动态面板数据模型的估计,所以本文只能采用变截距面板数据模型。

同时在进行估计时还需在固定效应面板数据模型与随机效应面板数据模型之间做出选择。一般在进行这种模型设定检验时采用豪斯曼(Hausmma)检验,它最早是由豪斯曼(Hausman,1978)提出的一种检验方法。由于笔者在进行Hausman检验时,软件提示检验失效,这可能是因为稳健标准误差与Haus―man检验的协方差值的假设不一致导致的,因此不能通过Hausmma检验来判定本文是选择随机效应模型还是固定效应模型。但高铁梅(2006)在其著作中指出;根据面板数据的特点,当数据中所包含的个体成员是所研究总体的所有单位时,即个体成员单位之间的差异可以被看作回归系数的参数变动时,选用固定影响模型比较合理。但是当个体成员单位随机地取自一个大的总体时,固定影响模型不太适合,此时选用随机影响模型更好。据此,因本文选取了所有发生控制权转移的并购样本,所以本文选用变截距固定效应模型进行估计可能更为合适,也就是说采用模型(2)进行估计。

(2)模型估计方法。因白仲林(2008)在其著作中指出了变截距固定效应模型的LSDV(1east square dummy variable)估计法的缺陷:首先,模型难以满足其前提假设,估计结果不是很有效;其次,由于引入了N个虚拟变量容易发生虚拟变量陷阱;最后对于固定的T,当N趋向无穷大时,只有斜率项的LSDV估计是一致的,而截距项的LSDV估计是非一致的,即LSDV存在着伴随参数问题。所以本文采用GLS法对模型(2)进行估计。

三、实证分析

(一)样本选择与数据来源

本文所取并购样本来自沪深两市A股上市公司,样本期间为2002~2008年。

为保证研究的可行性与有效性,本文遵循以下原则选取样本:(1)剔除一年之中发生一次以上并购事件的公司;(2)剔除数据缺失的公司;(3)剔除变量中存在极端异常值的公司。最先根据本文所限定的并购从国泰安数据库中选取2002~2008年间的并购事件1805起,再根据上述原则进行剔除后,最终确定由发生1172起并购事件的相应上市公司7年相应指标构成平衡面板数据集作为研究样本。具体的样本分布为:第一产业的并购样本为29个,第二产业的并购样本为761个;第三产业的并购样本为382个。

(二)实证结果分析

通过采用Eviews6,O的Panel workfile对样本数据按照预先设定的面板数据模型(2)进行固定效应变截距分析,得到结果如表1所示。

1 拟合优度检验。从表1的第七行可知,方程的调整可决系数达0.99,说明回归方程的解释能力为0.99,即总销售收入、职工薪酬、不同产业公司并购能够对公司劳动力需求的99%做出解释。

2 回归模型的总体显著性。从总体影响来看,表1的第九行显示F值为502.8701,表明模型在1%水平上显著,说明此模型中各因素对公司劳动力需求的共同影响是显著的。

3 单个回归系数的显著性。从单个因素来看,表1第二行系数0.23与T值53.20表明总销售收入对劳动力需求有显著正向影响,这与常理相符合,扩大产量增加劳动力;表1第三行系数0.073与T值25.50表明职工薪酬也对劳动力需求产生显著正向影响,这与常理相违背,可能因为公司销售收入增长速度大于职工薪酬增长速度,虽然职工薪酬增长,工资成本增加,但因销售更大比例增加足以抵消这种成本增加所带来的影响。这与国内学者常进雄(2005)的研究结论有相通之处,他通过实证研究得出:资本价格一实际的利率水平对就业没有影响;劳

动力的价格对就业弹性的影响不仅很小,而且与就业弹性是同方向变动,也就是说劳动力价格增加,就业弹性提高,从业人员也在增加,这与一般经济理论预测结果相反;表1第四行系数0.0248与T值0.7949表明第一产业所发生公司并购对公司劳动力需求有正向影响,但结果不显著,即并购的发生会导致公司就业人数增加2.4%左右。这主要因为第一产业的上市公司通过并购在短期内更多地寻求“协同效应”,即通过协同效应后,将会增强管理效果,扩大产出,从而也会雇佣更多的劳动力;表1第五行系数-0.0128与T值-2.59表明第二产业发生公司并购对公司劳动力需求有显著负向影响,第二产业发生公司并购导致公司就业减少1.3%左右,表1第六行系数-0.026与T值-2.657表明第三产业所发生公司并购对公司劳动力需求有显著负向影响,第三产业发生公司并购导致公司劳动力需求人数减少2.6%左右,这说明第二产业、第三产业的上市公司都是通过并购在短期内寻求“减员增效”,即通过裁减人员来达到提高组织效率与效益目的,从并购动机来说,可能规模经济动机与市场势力动机占主要地位。同时,第三产业发生公司并购导致劳动力需求人数减少的数量是第二产业的二倍,说明在第三产业中,上市公司更趋向于追求规模经济与市场势力,以此来实现公司的利益。

四、结论与启示

本文以2002~2008年沪深两市发生并购事件的A股上市公司相应指标构成的平衡面板数据集为研究总样本,首度应用经济学中的固定效应变截距面板数据模型从实证角度来研究不同产业公司并购对公司劳动力需求影响,得到结论:不同产业公司并购对公司劳动力需求有不同影响,第一产业的公司并购对公司劳动力需求有正向影响效应;第二产业、第三产业的公司并购对公司劳动力需求则有显著负向影响效应。显著负相关表明不断发生的并购会导致公司劳动力需求减少,从而导致失业人数增加,带来一系列社会问题。但是公司劳动力需求的重新调整可能需要一段较长时间,所以应从长期来考虑并购对劳动力需求的影响,而本文所得结论是短时性的;采用GLS对面板数据模型进行估计虽然比LSDV进行估计更为有效,但是当随机误差项与解释变量相关时,它是有偏非一致估计,因此应考虑采用工具变量法;同时被解释变量也可能会受到自身滞后量或其它变量滞后量影响,可以考虑采用动态面板数据模型,这将是后续研究需要改进的地方。

面板数据篇7

[关键词]物流需求;面板数据;GDP;一带一路

[DOI]1013939/jcnkizgsc201721028

1引言

自2013年9月、10月国家主席分别提出了共同建设“丝绸之路经济带”和“海上丝绸之路”构想以来,引起社会各界的高度重视,大量学者从各角度对“一带一路”进行了理论研究和实践探索。物流在当今经济发展中起到不可忽视的作用,甚至一个地区的物流现代化程度将会很大程度上制约各行各业的经济活跃程度,因此,“一带一路”物流角度的研究也尤为重要。

郭微等以福建和新疆为例,研究“一带一路”区域物流的供给和需求,指出福建和新疆的物流将有大幅的增长。Kenneth Button 等人针对物流系统中的运输环节建立相关的关系模型。何秋、桂寿平等人从系统动力学的角度出发,利用广州市的实例分析了物流与经济之间的关系。Heejoo Ham对区域间的货物运输对于区域间经济的规模和范围的影响进行了分析并建立相应的模型。而Kajal Lahiri深入分析了运输对于商业经济的影响,并根据一系列的统计数据建立了运输的经济指标体系,从而可以对运输进行预测。方秋艳更是从理论的角度分析了物流产生的本质,即物流的产生与发展是社会分工发展的产物,物流的发展也促进了区域经济的发展。物流产业在社会经济中一直具有相当重要的地位,它不仅为企业创造“第三利润”还为第三产业的发展开拓了更为广泛的疆域。

本文以陆上丝绸之路西北五省作为研究对象,采用面板数据模型对西北五省的物流需求及物流需求与经济发展的关系做出了探索性研究。

2指标选取及数据来源

21指标选取

物流需求涉及运输、仓储、包装、装卸搬运、流通加工和信息服务等方面的需求。物流需求的分析指标主要从物流需求的总量需求指标、功能需求指标和质量需求指标三个方面展开;总需求指标包括社会物流货物总额、社会物流总费用和货运运输和周转;功能需求指标包括物流需求中的运输量、仓储量及流通加工量。质量需求指标包括物流时间、物流成本和物流效率。根据数据的可获得性,本文选取货运周转量(WLZZ)作为物流需求指标。货运周转量是指各种运输工具在报告期内实际运送的每批货物重量分别乘其运送距离的累计数,单位为亿吨公里。物流需求的影响因素有经济总量及其增长速度、产业结构和产品结构、技术水平等诸多因素,本文选取最主要的影响因素GDP,通过分析各地经济发展对物流需求的影响,从而研究西北各地物流需求的状况。

22数据来源

本文所用数据主要来源于中华人民共和国国家统计局网站和西北五省2016年国民经济和社会发展统计公报。

3数据分析

31模型构建

建立单方程面板数据模型:

yit=αi+xitβi+μit, t=0, 1, 2, …, T; i=1, 2, …, N

其中 N 表示个体截面成员的个数,在此为五个省份,即N=5;T 表示观测时期总数,T=11;参数αit 表示模型的常数项,βit 表示对应于解释变量向量xit的1×k维系数向量,k 表示解释变量个数。随机误差项 uit 相互独立,且满足零均值、同方差为σ2u 的假设。

32模型估计

使用Eviews 60,利用西北五省2005―2015年的面板数据,选货运周转量(WLZZ)作为被解释变量,GDP为解释变量进行回归分析,结果整理如下表所示。

33模型检验

331F检验

对于西北五省2005―2015年货运周转量与GDP之间应该建立混合模型还是个体固定效应模型,应该进行检验。查F分布表,F005(10,43)=205,那么F=1283> F005(10,43)=205,则应该选取个体固定效应模型,即西北五省2005年~2015年货运周转量与GDP之间应该建立个体固定效应模型更适合该实际问题。

332Hausman检验

西北五省2005―2015年货运周转量与GDP之间应该建立个体随机效应回归模型还是个体固定效应回归模型,需要Hausman检验。检验得出Hausman统计量的值是0026301,相对应的概率是08712,即接受原假设,则应该建立个体随机效应模型,即选择模型四较切合本文的要求。

34模型结果

根据33部分模型检验分析可知,本文研究的西北五省货运周转量与GDP之间的关系可用模型四来说明。模型四具体形式如下:

WLZZ[DD(]∧[DD)]=41648+019GDP-6117D1+53351D2-4572D3-30357D4-12305D5

(24354)(212904)

R2=08970, SSE=1614737

其中括号内为常数项和一次项t值,均在5%的显著性水平下显著。Di为虚拟变量,定义为

Di=[JB({]1, 属于第i个个体, i=1, 2, 3, 4, 5

0, 其他[JB)]

由模型结果可以看出,西北五省GDP每增加一个单位时,引起货运周转量增加019个单位。陕西、甘肃、宁夏、青海、新疆的自发货运周转量分别为35532、94999、37076、11291、29343。可以看出,西北五省中,甘肃的自发货运周转量最大,即甘肃不受经济发展影响的货运周转量最大。

4结论

本文以“陆上丝绸之路”西北五省为研究对象,通过定性描述分析和面板数据定量分析,研究了“一带一路”西北五省物流需求的趋势以及物流需求随经济发展变化的关系。结果表明,西北五省物流需求均呈增长之势;五省的物流需求与经济发展呈高度相关,当经济增长1%时,会带来物流需求增长019%。

参考文献:

[1]郭微,徐庆,徐晓磊“一带一路”区域物流供需预测分析――以福建和新疆为例[J].特区经济,2016,(3):23-25

[2]Kenneth Button,Samantha TaylorInternational Air Transportation and Economic Development[J].Journal of Air Transport Management,2000,6(4):209-222.

[3]何秋,桂寿平,朱强区域物流系统动态学模型的建立与合理性检验[J].交通与计算机,2002(3):30-33.

[4]Heejoo Ham,Tschangho John Kim,David BoyceAssessment of Economic Impacts from Unexpected Events with an Interregional Commodity Flow and Multimodal Transportation Network Model[J].Transportation Research Part A;Policy and Practice,2005,39(10):849-860

面板数据篇8

关键词:面版数据模型;区域;不平衡发展

一、合肥经济圈区域经济不平衡测度

(一)研究区域概况

2009年11月15日,安徽省住房和城乡建设厅对《合肥经济圈城镇体系规划》进行公示,“合肥经济圈”的全貌首次展现。根据规划,合肥经济圈包括合肥、淮南、六安三市及桐城市,土地面积约3.86万平方公里,2011年7月,国务院的批复撤销地级巢湖市,设立县级巢湖市,由合肥市代管,原巢湖市管辖的庐江县也划归合肥市管辖。随着定远县的后期申请批准加入,目前合肥经济圈共包括合肥、淮南、六安三个地级市、滁州管辖的定远县和安庆管辖的桐城市,共十六个县(市)(图1)。

(二)合肥经济圈内部经济不平衡的测度

1.指标介绍

其中Tp表示总体指数,TWR为区际指数,TBR为表示加权的区内指数,i为市区数,j为第i市的县级市或县域,Y、Yi、Yij分别为经济圈、市、县的GDP增加值,N、Ni、Nij分别为经济圈、市、县的人口数。为方便研究,本文人为地把桐城市归于六安市计算,定远县归于淮南市计算。

2.地区不平衡的测度分析

图2中可以看出,合肥经济圈的Theil指数从2004年的0.2205增加到2011年的0.3248,是2004年的1.47倍多,年均增长速度为6.01%,说明合肥经济圈的区域总体差异的拉大较为迅速,起伏十分明显。自2004年起Theil指数一直增加,但到2008年区域总体指数就下降到0.2618,差距有所减缓,直至2009年一跃又升到0.3045的高度。同时也可以看出三个区域彼此的差距也越来越明显,比如区际指数从2004年的0.1003跳到2011年的0.1797。

图3分析了三大市域内部的经济差异情况,合肥区域差异指数已由2004年的0.2015增加到2011年的0.2107,增长1.05倍。在这期间差异总体上是增加的,但2008居于最低点,而在2009年的短暂回升后到2011年再次回落,整个趋势呈现起伏状。淮南区域和六安区域内部的区内差异一直处于相对平稳状态,两地区内部的差距相似,但2005年起淮南区域的经济差异都略高于六安。

二、研究方法与数据说明

(一)指标的选取及数据的来源

为了使选用的数据更具有代表性、操作的可行性与科学性,本文重点选择了以下指标:国内生产总值Y,全社会固定资产投资X1、在岗职工人数X2、第二、三产业的比重X3、政府支出X4、社会消费品零售总额X5、出口X6和实际利用外资X7。

本文结合合肥经济圈的发展现状,对合肥经济圈内16个县(市)经济发展差异状况进行了深入研究,构建了自2007―2011年经济发展状况差异评价的指标体系,研究中采用的数据主要来源于《安徽省统计年鉴》和各市县地方统计公报,依据实际数据,运用面板数据分析模型并借Eviews7.0分析软件,对合肥经济圈的综合实力进行估计。

(二)研究方法

本文选取的2007―2011年合肥经济圈评价内部差异的相关数据既非横截面数据,又非时间序列数据,而是两者的结合,即面板数据。单纯依靠时间序列数据使我们无法考虑不同地区的特征差异,而这些特征差异的影响在地区比较中是极为关键的,但单纯依靠横截面数据无法得到趋势规律,使区域比较研究就失去了意义。引入计量经济学面板数据分析常用的混合OLS 模型、固定效应模型和随机效应模型,根据模型前提假设的严格程度,依次通过:(1)混合OLS 模型和固定效应模型的F检验,确定是否适用混合OLS 模型;(2)固定效应模型和随机效应模型的Hausman检验,确定是否适用随机效应模型;(3)选定适合的测算模型,精确测算主要因子对地区经济发展的影响程度及其差异,并构建回归方程。

三、基于面板模型的差异成因实证分析

(一)模型设定的检验

1.确定是否适用混合OLS模型

由于所研究区域的时间选取范围较窄,选择的自变量较多,不便使用变系数模型,所以本文模型要用F统计量检验是采用混合模型还是变截距模型,其零假设H0:αi=α,模型中不同个体的截距项αi是相同的模型为混合模型,备选假设H1:模型中不同个体的截距项αi是不同的,模型为个体固定效应模型

2.确定是否适用随机效应模型

Hausman检验可从固定效应模型和随机效应模型中选择更优的模型。其原假设是先建立随机影响模型,然后检验该模型是否满足个体影响与解释变量不相关的假设,如果满足就确定为随机影响的形式,反之则将模型确定为固定影响的形式。运用Eviews7.0其检验统计量等于85.1302,远远大于自由度为7的χ2分布,因此要拒绝原假设,即固定效应模型比随机效应模型更合适。

(二)固定效应模型的实证分析

从各解释变量的系数符号、大小、显著性水平等方面来看:(1)固定资产投资对地区生产总值的贡献作用较大,变量十分显著,说明合肥经济圈内各县市总体发展水平很大程度上是靠当地的固定资产投资带动,但这种粗放型地增长,并不符合现在所提倡消费拉动增长的理念。(2)在岗职工人数的统计也非常显著,系数约为0.0023,劳动密集型产业依旧是主要产业形式,劳动力的变动对区域经济增长的边际效用大,这也是产生地区间经济差异的原因之一,劳动力更多流向城市,进一步造成地区间差异的扩大;(3)第二、三产业比重的系数虽为1.6039,但变量不显著,说明经济圈内的二、三产业力量还不够强大,缺乏高素质的劳动力和综合型人才,大多数企业的生产经营方式比较落后,效率底下;(4)财政支出系数较小但显著,其贡献率比起固定投资和劳动力稍低可能是地区内政府的支出重叠或资金流动方向欠妥导致财政支出没有发挥巨大的效用;(5)全社会消费品零售总额不仅不显著,还是负数,该变量每增加1%,地区产值减少33.89%,说明该地区消费需求不足,物价上涨幅度超过个人收入的增幅,经济对外依存度较高;(6)出口在1%的水平下呈显著性影响,目前地区内机电产品、高新技术产品出口呈良好增长态势,圈内对外输出产品的附加值日益加码,圈内民营企业日益壮大,成为进出口新生力量;(7)实际利用外资金额虽然在5%的水平下显著,但符号为负,说明招商引资的力度不够,该地区的科技水平低下难以吸引外资的亲睐。

从固定影响数值来看,包括除了模型中七个变量以外的不随时间而变化的其他因素的影响。固定效应较高的分别是肥东县,寿县和定远县等,正向偏离平均水平依次为71.03、59.99、55.02,说明这些县域的地区经济受模型中解释变量的影响较大;固定效应较小的六安、合肥和淮南市辖区的经济平均增长水平分别负向偏离平均水平-49.93、-248.93、-253.40,模型中的七个解释变量对这些县域(市)的地区经济影响不如其他县域那么显著,他们更容易受到其他因素影响,比如资源、城市化水平、科技实力、政策倾斜等。

四、结论与对策

对合肥经济圈出现的差异问题进行分析,笔者得出以下几点结论。

1.首先要加快经济结构调整,通过优化第一产业,提高第二产业,壮大第三产业,努力形成以高新技术产业为先导、基础产业和制造业为支撑、服务业全面发展的格局。还要注重金融服务业、教育文化、医疗、旅游、饮食、物流等方面发展,早日形成完善的第三产业系统,重点支持个别主导产业,形成产业链,综合利用环保等综合项目,严格控制高耗能行业增长,大力发展低耗能产业,发展循环经济。

2.在招商模式方面,除了给予各种优惠政策外,还可以实施“产业招商”,即利用企业优势,吸引上下游企业配套,形成大企业带动、小企业配套的模式,例如合肥、淮南等地的汽车、家电、装备制造和重工业等产业具有发展优势,应积极承接关联配套产业,做大做强支柱产业,延伸产业链,扩大零部件本地化生产,与主机厂形成良性的发展互动。充分发挥中介机构的优势,大力开展委托招商、招商,降低招商成本,提高招商效率。

3.要投入必要的资金,加快公共基础设施建设,优化县市经济发展的外部环境。建立规范的转移支付制度,积极探索财政横向转移支付制度,有效地缩小地区经济发展差距;运用财税政策支持、引导地区发展,以市场为导向,扬长避短,充分发挥本地资源上的比较优势,确定各自的主导产业;加大财税支持力度,积极支持县市民营经济发展,为民营经济发展营造公开、公平、公正的财税政策环境。

4.合肥经济圈正处在工业化、城镇化的快速发展阶段,对于地区的出口额不仅要增加,还要提高出口竞争力,调整出口结构,重点促进优势产品、劳动密集型产品和高新技术产品出口,努力保持该地区出口产品在国际市场的份额。另外提高产品的质量,增加产品附加值,逐渐走属于自己的品牌路线,这样不仅能增加出口,也能拉动内需,促进该经济圈的发展。

参考文献:

[1]蔡玉倩,翟有龙.河北省区域经济差异实证分析[J].经济与管理,2008(12).

[2]冯俊新.经济发展与空间布局:城市化、经济集聚和地区差异[M].中国人民大学出版社,2012.

[3]吉新峰.中国区域协调发展战略效应评价――基于区域差异的分析[M].经济管理出版社,2012.

[4]刘传江,董延芳.武汉都市圈经济发展差距研究[J].经济问题探索,2007(2).

[5]李正辉,徐维.区域科技创新与经济增长: 基于省级面板数据模型的实证分析[J].科技与经济,2011(2).

[6]马国霞,田玉军,王志强.京津冀都市圈经济增长区域差异及其动力机制量化分析[J].中国科学院研究生院学报,2007(4).

[7]周.中国地区间经济发展不平衡――水平测度和成因探究[J].山西财经大学学,2012(2).

*基金项目:上海市研究生创新基金项目阶段性成果(编号:JWCXSL1302)。

上一篇:mysql数据库范文 下一篇:关系型数据库范文