论文部分内容阅读
[摘 要]准确地测算就业弹性是研究经济增长与就业之间关系的起点,但当前国內外的研究主要集中于就业弹性的静态测算与走势分析,均未能从动态有效区分经济增长中规模效应与结构效应对就业的影响。使用基于面板数据的固定影响变截距模型和设定新的计量方程分析和研究就业弹性是解决此问题的一条新思路。
[关键词]就业弹性;弧弹性;双对数模型;变截距模型
[中图分类号]F224.0 [文献标识码]A [文章编号]1003-3890(2007)11-0053-06
自20世纪90年代以来,经济增长和就业增进未能同步扩张日益成为解读中国经济发展的难点所在,并受到了经济学家们越来越多的关注。当前国内对此问题的研究思路之一是考察就业弹性,这一思路实际是以新古典增长理论为依托,从经济增长的长期视角来考察就业量的演变趋势,它在理论上是完全自治的,因而为大多数研究者所采用。研究者主要从计算方法、计算口径、变动趋势和变动原因等各个层面对就业弹性作了大量实证研究,但从已有的文献来看,经济学界对这一问题的研究并不充分,当前的研究集中于就业弹性的静态测算和走势分析,而未能在经济演进的背景下对就业弹性进行更深入的动态考察。更重要的是,由于对计量技术的把握尚有欠缺,对就业弹性测算方法的准确性问题至今缺乏较系统细致的讨论,对就业弹性的影响因素分析还尚处于起步阶段,定量分析与定性分析的结论常存在抵牾之处。理论研究中存在的这些问题都说明对就业弹性测算方法仍需更深入严谨的探讨。 笔者力图在全面梳理国内外重要文献的基础上,在动态考察经济增长的规模效应和结构效应的背景下,通过设定新的计量模型,运用基于面板数据的固定影响变截距模型,测算和分析了中国的总体及分产业就业弹性值。
一、就业弹性测算方法
就业弹性的本意是考察每单位GDP的增长能带动多少单位就业量的增加,对这一概念反映经济增长与就业增进之间关系的“优度”一直存在争议。基于笔者的研究目的,本文不涉及有关就业弹性经济意义的评论,而专注于回应对就业弹性测量方法的批评。
(一)研究路径
从对当前文献的考察来看、就业弹性测算技术的发展路径大体可以描述为:初期研究都以弧弹性方法为起点,进而转至使用以双对数模型为基准的计量模型,但在双对数模型的使用上则产生分岔,下文拟对此作一简要回顾。
弧弹性方法是指依据弹性的定义,采用中点公式直接计算的方法。这一方法简单易行,所需数据少,因而大多数研究者,如Rao&Bhanoji(1992)、ILO(1999)、张车伟等(2002)、蔡昉等(2004)均采用此方法计算就业弹性的逐年值。但就经济分析而言,这种方法实际上把就业人数增长完全归因于经济的增长,不考虑其他因素的影响,经济意义不完备;就技术层面而言,这一方法也没有任何拓展空间。而通过建立计量模型测算就业弹性可以有效地克服弧弹性方法的上述不足,计量模型不仅经济意义充足,技术进步和资本投入等因素的作用都可以包含到截距中并具有容易扩展的优势,既可以增加自变量,也可以据此建立面板数据模型,从而对就业弹性做更深入的分析和考察。
计量分析依据所采用数据类型的不同而选择不同的回归方法,但其基准模型通常采取如下形式的双对数模型:
lnL=αL+β1nY+u
在对双对数模型的运用上,经济学家发展出两条路径:
路径一:使用新的计量方法,由O13回归乃至更复杂的GLS回归和最大似然回归等经济计量技术。
大体而言,双对数模型在初始阶段的运用有两种形式:第一种形式是通过对时间序列数据进行OLS回归,得出某一时间段的就业弹性值。这一方法虽然存在无法测算就业弹性逐年值的内在缺陷,但仍为国内外学者广为使用。通常的做法是将较长的时间序列数据拆分为若干时间段,进而测算出不同时期的就业弹性值并进行趋势判断,如ILO(2000)、张本波(2002)、赵建国(2003);第二种形式则是通过对横截面数据进行OLS回归测算出就业弹性的逐年值,通常的做法是利用某一国家的省级数据测算出该国的GDP总量及分产业的就业弹性逐年值。这一方法目前仅见国外学者所使用,如Padalino.&Vivarelli(1999)、ILO(2000),国内学者则未见使用。
但上述两种方法仍有其不足之处。第一种方法通常会遇到这样的窘境:如果不对时间序列数据拆分,计算出的结果分析价值很小,而拆分又会遇到样本容量太小,回归结果可靠性低的问题。这一点在对中国就业弹性的研究中尤为突出。第二种方法通常不会遇到样本容量问题,但计算结果又严重受制于经济体的数据结构,计算出来的结果常常偏高,可信性同样偏低。
为了解决数据结构和样本容量的问题,经济学家又将面板数据引入就业弹性的研究之中,通过GLS回归测算就业弹性的时期值。当前的研究主要从两个方向展开:一是测算某一经济体随时间而变的就业弹性时期值,如Solimano&Andres&Guillermo(2002);一是测算某一经济体随样本成员而变的就业弹性时期值,如张江雪(2005)。
路径二:设定新的计量方程,通过添加新的控制变量以期求得更为精确可靠的弹性值并揭示更多的经济意义。
从数据类型的角度而言,上一条研究思路基本已经走到了尽头,因此国外学者在面板模型的基础上,又从解释变量的角度进行了新的尝试。如Daniel&Asep&Sumaao(2007)所言,对就业弹性的原有研究只注重劳动力需求移动的研究,而完全忽视了劳动力供给移动的研究。因而经济学家开始将供给因素纳入计量模型的设定之中。如Sdimano&Larrain(2002)将实际工资纳入解释变量,Daniel&Asep&Sumarto(2007)则将劳动参与率的变化率纳入解释变量。
需要指出的是,所有这些新增解释变量的选择都对应于研究者所要解决的经济问题,而非简单地解决零条件均值,从而求出更精确的估计值。就业弹性的这一最新研究思路在下文的研究中同样得到鲜明的体现。
(二)简要评论
从对当前研究文献的回顾来看,当前的研究主要在两个方面尚存在缺陷,而如何解决这方面的缺陷,正是本文尝试设定新模型的意义所在。
首先,基于面板数据的计量模型毫无疑问是今后研究的主流,就已有文献来看,目前仍未将更复杂的面板数据模型用于测算就业弹性的逐年值,而就业弹性逐年值的测算是进行更深人研究的数据基础,这不能不说是当前研究的缺憾所在。
其次,尽管经济学家已经开始考虑除需求之外的其他影响因素,但仍缺乏基于经济演进的研究视,角,这也是当前国外研究者对就业弹性测量方法最重要的批评意见,从理论上说,经济总量扩张会对 就业产生两种效应:一是直接的规模效应,即各产业GDP的增长会增加各产业的劳动力就业量;二是间接的结构效应,即经济总量的增长会引发就业结构转变,使劳动力从一个产业流向另一个产业。因此,对就业弹性较完备的测量应能区分这两种效应,说明某产业的就业吸纳量哪些是由于经济结构转变带来的,哪些是由于产业扩张导致的。但正如Kelly(2000)所言,现有的测算均无法区分总量GDP和各产业GDP的增长对就业的影响。
二、方法论和计量模型的设定
本文的研究将表明,将上述两种研究思路结合起来,通过构建固定影响的变截距模型,设定新的计量方程,就业弹性测量方法的上述不足是完全可以改进的。在此,笔者将详细探讨这一新模型的基本原理和实现方式。
(一)变截距模型的基本思想
随着计量经济技术的发展,理论上我们可以利用基于面板数据的变截距模型求得就业弹性的逐年值。鉴于变截距模型在就业弹性测算的应用中很少,笔者先对其基本原理略作介绍。
变截距模型的回归方程形式如下:
ylt=et+X′itβi+μi+εit= 1,2,……N t=1,2,…T (1)
在以上面板数据模型中,Xit是 1×k维解释变量向量,βi是k×1维系数向量。μi是个体效应,εXit是残余扰动项,根据对山的不同假定,面板数据模型被分为固定效应模型和随即效应模型,如果μi是一个不独立于X’。的个体常数,则称固定效应模型,如果μi是独立于X,的随即误差项,则称随机效应模型。
将模型设定为固定效应还是随机效应的常用检验方法是Hausman检验,其基本思路是在μi与X'it独立的零假设下构造统计量,检验在零假设下的B估计量是否严格异于备择假设下的估计量,如果拒绝了零假设,就认为应该采用固定效应模型,不能采用随机效应模型,反之,采用随机效应模型就是合理的。随机效应模型是对固定效应模型加上了更强的假定,是它的一个特例,或者说,Hausman检验是在用来识别数据是否满足一个更强的假定的特征的,采用固定效应模型是一种更为谨慎的策略。
在许多研究中,代表个体特征的一些变量或者是由于不可观测或者是出于研究方便便而没有被作为自变量纳入模型,但是这些变量又明显与被考察的自变量Xit相关,这时,可以允许直接采用固定效应模型而省略Hausman检验的程序。在本文的研究中,像固定资产投资这样的因素显然对就业有重要影响,同时它又与总产出高度相关,采用随机效应模型就要求忽略这种相关性,这显然是很不合理的,加之中国各省份在地理经济特征上的巨大差异,我们有理由认为基于省级面板数据的回归是无法采用随机效应模型的,这也是在此处没有进行Huasman检验而采用固定效应模型的依据。
在样本量较小的情况下,对固定效应模型的估计,可以将μi作为虚拟变量来处理,亦即生成N个虚拟变量用OLS回归来估计,可见在固定效应模型中,每一个μi在本质上都是一个参数,与随机效应中代表残差项是不同的,固定效应模型会损失一些自由度,这也是放弃对模型的更强假定的代价,对随机效应的估计通常采用GLS,不存在损失自由度的问题,所以对于截面个体太少的一组样本数据的固定效应模型就无法进行回归,笔者只能将部分区域加以合并再进行回归。
(二)经济演进就业效应的计量模型
在固定影响变截距模型的基础上,笔者设定如下计量模型:
lnL8pt=Cltβ2tlnY8pt+β2tlnYtotpt+λ1+upt (2)
式2中的上标s代表各产业,下标p代表各省,L8pt、8pt分别是第p个省产业s第的就业量和GDP,Ytotpt是第p个省第t的GDP总量。这一模型有两个特点:(1)该模型中两个待估的弹性系数β1和β1是随时间可变的;(2)该模型能有效地区分出经济扩张的两种效应。在方程(2)中,β1表示直接的规模效应,即某一产业纯粹由于自身规模扩张带来的就业弹性的变动;β2示整体效应,即由于经济整体扩张所导致的某一产业的就业弹性的变动,将(β2-β1,)即是上文所说的间接的结构效应,如果结构效应为负,那就意味着即经济整体扩张导致劳动力从本产业中转移出去;如果结构效应为正,那就意味着经济整体扩张导致劳动力从其他产业转移到本产业之中。
从理论上而言,可以直接将省级数据代入方程(2),但是考虑到中国不同经济地带的情况差异很大,如果直接利用全部省级数据进行CLS回归,离差越大的样本取值在计算中所占的权重越大,这会导致就业弹性的估计值偏高。更严重的是,这样回归出来的系数也是不显著的。为克服这一缺陷,笔者将全国分成四大经济区域,先分别计算各大经济地带的各产业和总量GDP的就业弹性,而后以各大经济地带在全国分产业和总量GDP的比重为权数。通过加权平均的办法计算全国分产业和总量GDP的就业弹性。
三、测算口径与数据来源
在研究和测算就业弹性时,就业弹性的测算口径,即是否考虑隐性失业是基于发展中国家背景的一个极为特殊而又重要的问题。因为这一问题直接关系到因变量的取值,所以有必要在此加以说明。
目前尚未见国外学者在研究中涉及这一问题,但国内对这一问题的研究较多。大体来说当前国内研究分为两派:一派以张车伟等(2002)、齐建国(2002)、常进雄(2005)等为代表(姑且称为名义派),他们的研究都以统计年鉴上的名义就业量为依据,不考虑隐性失业问题。而另一派以龚玉泉和袁志刚(2002)、邓志旺等(2002)、吕民乐(2006)为代表(姑且称为实际派),他们明确指出,由于隐性失业的存在,基于统计数据计算的就业增长弹性系数并不是真正的就业弹性,而仅是名义就业弹性系数,实际就业弹性应该以有效就业为基础。
笔者认为,从稳健性估计和分析意义的角度来说,对就业弹性的测算不必考虑隐性失业问题,直 接采用名义就业量是更为可取的做法。首先,实际派方法的理论基础是有问题的。“隐性失业”一词来源于发展经济学,其精确定义是指那些边际生产力大于0而又小于其制度实际工资(IRW)的劳动者。由此定义可以看出,隐性失业者同样创造GDP,只是“人不敷出”,如果我们在计算GDP就业弹性时,将其从劳动力投人中扣除,实际上是否认了他们对GDP的贡献额,这是不合理的。由此造成的问题是,如果我们据此测量就业弹性并对之进行回归分析,因变量可能会存在严重的向下偏误。其次,中国劳动统计体系尚不完备,城乡分割制度在就业人员统计中的影响至今依然存在,公布的统计数据往往低估了实际就业总量。即使考虑到隐性失业转化为有效就业的影响,两项作用的合力影响是难以估计的。因此本文的测算都直接采用统计年鉴公布数据,不再进行各种基于有效就业量的调整。
为保持数据的一致性,本文所采用的数据全部来自各年的《中国统计年鉴》,鉴于中国统计制度、统计指标和统计口径多次变动和调整,我们需要对数据来源进行较详细的说明。
1.本文所用数据的时间序列为1990~2005年。之所以截取这个时间段是因为自1990年开始,中国的就业总量数据依据人口抽样调查数据推算获得,而之前的社会劳动者总量数据依据各单位报表合并方法获得,1990之前和之后的数据不具备经济分析上的可比性。
2.本文所采用数据指标包括GDP和就业人员的全国和省级总量数据、分产业的GDP和就业人员的全国和省级数据。其中,1997年以前各年各指标省级数据样本为29个,自1997年始各年各指标省级数据样本为30个。
3.1998年以后GDP总量及分产业的全国数据依《2006年中国统计年鉴》,即采用了2004年经济普查后的调整数据。1990~2000年,就业人员总计、城镇和乡村就业人员小计资料根据第五次全国人口普查资料重新调整,2001年及以后资料根据人口变动抽样调查资料推算。
4.1998年以后的各年各指标省级数据均采用各年《中国统计年鉴》公布数据,未采用根据2004年经济普查后的调整数据。其中,1990年分产业生产总值省级数据依《1991年中国统计年鉴》中的“各地区社会总产值”计算得到,1995年数据依《1997年中国统计年鉴》推算获得;1990,1992年分产业就业量省级数据依1991~1993年《中国统计年鉴》中的“各地区分行业社会劳动者人数”合并计算得到。
5.本文研究所使用的各类GDP数据均采用名义值,不进行平减指数调整。这样做的理论依据是Lucas的信息孤岛理论,即认为经济主体更多地是依据名义价格而不是实际价格进行行为调整。
四、测算结果及比较分析
在此,笔者先对基于固定影响的变截距模型所得计量结果进行分析,进而从方法论的角度将其同传统方法所得测算结果进行简要比较。
(一)实证结果分析
计量方程(2)的回归结果表明:西北区域的分产业和总量GDP就业弹性都是不显著的,华北和中南区域只有第二产业的回归结果是基本显著的,华东区域的第一、二产业的回归结果除个别年份都是显著的。基于此,笔者无法用加权平均的办法计算出全国的分产业就业弹性取值。但出于方法论探讨的目的,本文选择以华东地区第一和第二产业的就业弹性测算结果,对所建立的回归模型展开分析。
这样做的原因有三点:首先,华东地区是中国经济最为发达的地区,也是城市化最高的地区,这一地区的经济发展程度已经超越了刘易斯转折点,农村不再具有劳动力蓄水池的功能,因而对第一产业的分析是有意义的;其次,华东地区虽然不是中国的重工业集中地带,但作为最早的沿海开放地带,其制造业,尤其是轻工业的发展到了相当成熟的程度,因而有利于分析经济总量扩张对就业的结构效应;最后,中国第三产业的省级数据由于统计制度的原因,统计往往是不全面的,对其进行分析的数据基础比较薄弱,事实上,所有关于第三产业的区域回归分析结果绝大多数都是不显著的。
考虑到上述因素,笔者给出如表1所示的回归结果。
不难看出,表1所列数据具有明确的经济意义。首先,β1的取值全部为正,这说明某一产业自身规模的扩张必然吸纳更多的劳动力,这同新古典增长函数的内涵是完全相匹配的;其次,第一产业的结构效应系数全部为负,说明华东地区的确存在着持续的农业劳动力向二产和三产转移的过程,这同刘易斯的二元经济理论以及钱德勒大国模型的预言是完全相吻合的;第三,第二产业的结构效应系数有些年份为正,有些年份为负,这主要是由于政府大力推行积极就业战略,结构效应系数基本取正值,这一变动态势同华东地区第二产业的组成结构及历史演变也是相一致的。
上述分析表明,在数据基本可靠的前提下,基于方程(2)所回归的结果是可信的,统计意义和经济意义都是显著的,并且确实能有效地揭示就业弹性的变动特点,有效地区分和揭示经济总量扩张所具有的两种就业效应。这就证明,笔者提出的这一计量模型和计量方法是可信的。
(二)基于经济意义的比较分析
如前文所述,国内外学者采用不同方法对就业弹性的测算做了大量研究,如张车伟和蔡防(2002)、常进雄(2005)、吕民乐(2006),将他们的测算结果同本文的计算结果相比较,笔者发现,从经济演进的视角观察就业弹性的变动特点,能够揭示出若干新的结论:
1.观察表1中第一产业的规模效应、总量效应和结构效应数据序列,不难得出以下三个结论:(1)经济增长中农业就业的总量效应和结构效应表现为稳定的负值时间序列数据,这表明随着经济结构的不断演进,将会有越来越多的劳动力从农业转移到第二和第三产业中;(2)结构效应取值的绝对值是相当大的,平均取值在0.9左右,并呈现逐渐增大的势头,这表明随着经济的进一步发展,会有越来越多的劳动力从农业中转移出去;(3)规模效应的取值虽然为正值,但其平均值仅为0.45左右,并呈现逐渐减小的态势,这说明即使进一步扩大农业的生产规模,它所能吸收的劳动力数量也是有限的,而且吸纳力度会越来越小。
以上三点清晰地表明,农业的就业吸纳潜力是极为有限的。要解决剩余劳动力或隐性失业问题,只能依托二、三产业的发展,那种继续将农村和农业作为剩余劳动力蓄水池的做法是不符合经济发展要求的。
2.以往对第二产业就业弹性的测算结果均表明,第二产业的就业弹性这些年不断下降并出现负值。有些研究者据此认为,中国的第二产业已经出现了劳动排斥现象,继续推行重工业化战略只会加剧失业问题。笔者的测算结果表明,这一观点是有失偏颇的。事实上,第二产业的规模效应基本取正值,除极端年份外,这一取值还是很高的。这说明。扩大工业规模,加工业和重工业的加速发展依然是吸纳就业的有效途径。传统方法所测算出来的结果更多地体现了经济演进导致的产业结构转换效应,并不能由此认为第二产业存在劳动排斥现象。
责任编辑:学 诗
责任校对:涵 育
[作者简介]陆梦龙(1976—),男,北京人,中国社会科学院研究生院2005级在读博士生,研究方向为经济增长与失业。
[关键词]就业弹性;弧弹性;双对数模型;变截距模型
[中图分类号]F224.0 [文献标识码]A [文章编号]1003-3890(2007)11-0053-06
自20世纪90年代以来,经济增长和就业增进未能同步扩张日益成为解读中国经济发展的难点所在,并受到了经济学家们越来越多的关注。当前国内对此问题的研究思路之一是考察就业弹性,这一思路实际是以新古典增长理论为依托,从经济增长的长期视角来考察就业量的演变趋势,它在理论上是完全自治的,因而为大多数研究者所采用。研究者主要从计算方法、计算口径、变动趋势和变动原因等各个层面对就业弹性作了大量实证研究,但从已有的文献来看,经济学界对这一问题的研究并不充分,当前的研究集中于就业弹性的静态测算和走势分析,而未能在经济演进的背景下对就业弹性进行更深入的动态考察。更重要的是,由于对计量技术的把握尚有欠缺,对就业弹性测算方法的准确性问题至今缺乏较系统细致的讨论,对就业弹性的影响因素分析还尚处于起步阶段,定量分析与定性分析的结论常存在抵牾之处。理论研究中存在的这些问题都说明对就业弹性测算方法仍需更深入严谨的探讨。 笔者力图在全面梳理国内外重要文献的基础上,在动态考察经济增长的规模效应和结构效应的背景下,通过设定新的计量模型,运用基于面板数据的固定影响变截距模型,测算和分析了中国的总体及分产业就业弹性值。
一、就业弹性测算方法
就业弹性的本意是考察每单位GDP的增长能带动多少单位就业量的增加,对这一概念反映经济增长与就业增进之间关系的“优度”一直存在争议。基于笔者的研究目的,本文不涉及有关就业弹性经济意义的评论,而专注于回应对就业弹性测量方法的批评。
(一)研究路径
从对当前文献的考察来看、就业弹性测算技术的发展路径大体可以描述为:初期研究都以弧弹性方法为起点,进而转至使用以双对数模型为基准的计量模型,但在双对数模型的使用上则产生分岔,下文拟对此作一简要回顾。
弧弹性方法是指依据弹性的定义,采用中点公式直接计算的方法。这一方法简单易行,所需数据少,因而大多数研究者,如Rao&Bhanoji(1992)、ILO(1999)、张车伟等(2002)、蔡昉等(2004)均采用此方法计算就业弹性的逐年值。但就经济分析而言,这种方法实际上把就业人数增长完全归因于经济的增长,不考虑其他因素的影响,经济意义不完备;就技术层面而言,这一方法也没有任何拓展空间。而通过建立计量模型测算就业弹性可以有效地克服弧弹性方法的上述不足,计量模型不仅经济意义充足,技术进步和资本投入等因素的作用都可以包含到截距中并具有容易扩展的优势,既可以增加自变量,也可以据此建立面板数据模型,从而对就业弹性做更深入的分析和考察。
计量分析依据所采用数据类型的不同而选择不同的回归方法,但其基准模型通常采取如下形式的双对数模型:
lnL=αL+β1nY+u
在对双对数模型的运用上,经济学家发展出两条路径:
路径一:使用新的计量方法,由O13回归乃至更复杂的GLS回归和最大似然回归等经济计量技术。
大体而言,双对数模型在初始阶段的运用有两种形式:第一种形式是通过对时间序列数据进行OLS回归,得出某一时间段的就业弹性值。这一方法虽然存在无法测算就业弹性逐年值的内在缺陷,但仍为国内外学者广为使用。通常的做法是将较长的时间序列数据拆分为若干时间段,进而测算出不同时期的就业弹性值并进行趋势判断,如ILO(2000)、张本波(2002)、赵建国(2003);第二种形式则是通过对横截面数据进行OLS回归测算出就业弹性的逐年值,通常的做法是利用某一国家的省级数据测算出该国的GDP总量及分产业的就业弹性逐年值。这一方法目前仅见国外学者所使用,如Padalino.&Vivarelli(1999)、ILO(2000),国内学者则未见使用。
但上述两种方法仍有其不足之处。第一种方法通常会遇到这样的窘境:如果不对时间序列数据拆分,计算出的结果分析价值很小,而拆分又会遇到样本容量太小,回归结果可靠性低的问题。这一点在对中国就业弹性的研究中尤为突出。第二种方法通常不会遇到样本容量问题,但计算结果又严重受制于经济体的数据结构,计算出来的结果常常偏高,可信性同样偏低。
为了解决数据结构和样本容量的问题,经济学家又将面板数据引入就业弹性的研究之中,通过GLS回归测算就业弹性的时期值。当前的研究主要从两个方向展开:一是测算某一经济体随时间而变的就业弹性时期值,如Solimano&Andres&Guillermo(2002);一是测算某一经济体随样本成员而变的就业弹性时期值,如张江雪(2005)。
路径二:设定新的计量方程,通过添加新的控制变量以期求得更为精确可靠的弹性值并揭示更多的经济意义。
从数据类型的角度而言,上一条研究思路基本已经走到了尽头,因此国外学者在面板模型的基础上,又从解释变量的角度进行了新的尝试。如Daniel&Asep&Sumaao(2007)所言,对就业弹性的原有研究只注重劳动力需求移动的研究,而完全忽视了劳动力供给移动的研究。因而经济学家开始将供给因素纳入计量模型的设定之中。如Sdimano&Larrain(2002)将实际工资纳入解释变量,Daniel&Asep&Sumarto(2007)则将劳动参与率的变化率纳入解释变量。
需要指出的是,所有这些新增解释变量的选择都对应于研究者所要解决的经济问题,而非简单地解决零条件均值,从而求出更精确的估计值。就业弹性的这一最新研究思路在下文的研究中同样得到鲜明的体现。
(二)简要评论
从对当前研究文献的回顾来看,当前的研究主要在两个方面尚存在缺陷,而如何解决这方面的缺陷,正是本文尝试设定新模型的意义所在。
首先,基于面板数据的计量模型毫无疑问是今后研究的主流,就已有文献来看,目前仍未将更复杂的面板数据模型用于测算就业弹性的逐年值,而就业弹性逐年值的测算是进行更深人研究的数据基础,这不能不说是当前研究的缺憾所在。
其次,尽管经济学家已经开始考虑除需求之外的其他影响因素,但仍缺乏基于经济演进的研究视,角,这也是当前国外研究者对就业弹性测量方法最重要的批评意见,从理论上说,经济总量扩张会对 就业产生两种效应:一是直接的规模效应,即各产业GDP的增长会增加各产业的劳动力就业量;二是间接的结构效应,即经济总量的增长会引发就业结构转变,使劳动力从一个产业流向另一个产业。因此,对就业弹性较完备的测量应能区分这两种效应,说明某产业的就业吸纳量哪些是由于经济结构转变带来的,哪些是由于产业扩张导致的。但正如Kelly(2000)所言,现有的测算均无法区分总量GDP和各产业GDP的增长对就业的影响。
二、方法论和计量模型的设定
本文的研究将表明,将上述两种研究思路结合起来,通过构建固定影响的变截距模型,设定新的计量方程,就业弹性测量方法的上述不足是完全可以改进的。在此,笔者将详细探讨这一新模型的基本原理和实现方式。
(一)变截距模型的基本思想
随着计量经济技术的发展,理论上我们可以利用基于面板数据的变截距模型求得就业弹性的逐年值。鉴于变截距模型在就业弹性测算的应用中很少,笔者先对其基本原理略作介绍。
变截距模型的回归方程形式如下:
ylt=et+X′itβi+μi+εit= 1,2,……N t=1,2,…T (1)
在以上面板数据模型中,Xit是 1×k维解释变量向量,βi是k×1维系数向量。μi是个体效应,εXit是残余扰动项,根据对山的不同假定,面板数据模型被分为固定效应模型和随即效应模型,如果μi是一个不独立于X’。的个体常数,则称固定效应模型,如果μi是独立于X,的随即误差项,则称随机效应模型。
将模型设定为固定效应还是随机效应的常用检验方法是Hausman检验,其基本思路是在μi与X'it独立的零假设下构造统计量,检验在零假设下的B估计量是否严格异于备择假设下的估计量,如果拒绝了零假设,就认为应该采用固定效应模型,不能采用随机效应模型,反之,采用随机效应模型就是合理的。随机效应模型是对固定效应模型加上了更强的假定,是它的一个特例,或者说,Hausman检验是在用来识别数据是否满足一个更强的假定的特征的,采用固定效应模型是一种更为谨慎的策略。
在许多研究中,代表个体特征的一些变量或者是由于不可观测或者是出于研究方便便而没有被作为自变量纳入模型,但是这些变量又明显与被考察的自变量Xit相关,这时,可以允许直接采用固定效应模型而省略Hausman检验的程序。在本文的研究中,像固定资产投资这样的因素显然对就业有重要影响,同时它又与总产出高度相关,采用随机效应模型就要求忽略这种相关性,这显然是很不合理的,加之中国各省份在地理经济特征上的巨大差异,我们有理由认为基于省级面板数据的回归是无法采用随机效应模型的,这也是在此处没有进行Huasman检验而采用固定效应模型的依据。
在样本量较小的情况下,对固定效应模型的估计,可以将μi作为虚拟变量来处理,亦即生成N个虚拟变量用OLS回归来估计,可见在固定效应模型中,每一个μi在本质上都是一个参数,与随机效应中代表残差项是不同的,固定效应模型会损失一些自由度,这也是放弃对模型的更强假定的代价,对随机效应的估计通常采用GLS,不存在损失自由度的问题,所以对于截面个体太少的一组样本数据的固定效应模型就无法进行回归,笔者只能将部分区域加以合并再进行回归。
(二)经济演进就业效应的计量模型
在固定影响变截距模型的基础上,笔者设定如下计量模型:
lnL8pt=Cltβ2tlnY8pt+β2tlnYtotpt+λ1+upt (2)
式2中的上标s代表各产业,下标p代表各省,L8pt、8pt分别是第p个省产业s第的就业量和GDP,Ytotpt是第p个省第t的GDP总量。这一模型有两个特点:(1)该模型中两个待估的弹性系数β1和β1是随时间可变的;(2)该模型能有效地区分出经济扩张的两种效应。在方程(2)中,β1表示直接的规模效应,即某一产业纯粹由于自身规模扩张带来的就业弹性的变动;β2示整体效应,即由于经济整体扩张所导致的某一产业的就业弹性的变动,将(β2-β1,)即是上文所说的间接的结构效应,如果结构效应为负,那就意味着即经济整体扩张导致劳动力从本产业中转移出去;如果结构效应为正,那就意味着经济整体扩张导致劳动力从其他产业转移到本产业之中。
从理论上而言,可以直接将省级数据代入方程(2),但是考虑到中国不同经济地带的情况差异很大,如果直接利用全部省级数据进行CLS回归,离差越大的样本取值在计算中所占的权重越大,这会导致就业弹性的估计值偏高。更严重的是,这样回归出来的系数也是不显著的。为克服这一缺陷,笔者将全国分成四大经济区域,先分别计算各大经济地带的各产业和总量GDP的就业弹性,而后以各大经济地带在全国分产业和总量GDP的比重为权数。通过加权平均的办法计算全国分产业和总量GDP的就业弹性。
三、测算口径与数据来源
在研究和测算就业弹性时,就业弹性的测算口径,即是否考虑隐性失业是基于发展中国家背景的一个极为特殊而又重要的问题。因为这一问题直接关系到因变量的取值,所以有必要在此加以说明。
目前尚未见国外学者在研究中涉及这一问题,但国内对这一问题的研究较多。大体来说当前国内研究分为两派:一派以张车伟等(2002)、齐建国(2002)、常进雄(2005)等为代表(姑且称为名义派),他们的研究都以统计年鉴上的名义就业量为依据,不考虑隐性失业问题。而另一派以龚玉泉和袁志刚(2002)、邓志旺等(2002)、吕民乐(2006)为代表(姑且称为实际派),他们明确指出,由于隐性失业的存在,基于统计数据计算的就业增长弹性系数并不是真正的就业弹性,而仅是名义就业弹性系数,实际就业弹性应该以有效就业为基础。
笔者认为,从稳健性估计和分析意义的角度来说,对就业弹性的测算不必考虑隐性失业问题,直 接采用名义就业量是更为可取的做法。首先,实际派方法的理论基础是有问题的。“隐性失业”一词来源于发展经济学,其精确定义是指那些边际生产力大于0而又小于其制度实际工资(IRW)的劳动者。由此定义可以看出,隐性失业者同样创造GDP,只是“人不敷出”,如果我们在计算GDP就业弹性时,将其从劳动力投人中扣除,实际上是否认了他们对GDP的贡献额,这是不合理的。由此造成的问题是,如果我们据此测量就业弹性并对之进行回归分析,因变量可能会存在严重的向下偏误。其次,中国劳动统计体系尚不完备,城乡分割制度在就业人员统计中的影响至今依然存在,公布的统计数据往往低估了实际就业总量。即使考虑到隐性失业转化为有效就业的影响,两项作用的合力影响是难以估计的。因此本文的测算都直接采用统计年鉴公布数据,不再进行各种基于有效就业量的调整。
为保持数据的一致性,本文所采用的数据全部来自各年的《中国统计年鉴》,鉴于中国统计制度、统计指标和统计口径多次变动和调整,我们需要对数据来源进行较详细的说明。
1.本文所用数据的时间序列为1990~2005年。之所以截取这个时间段是因为自1990年开始,中国的就业总量数据依据人口抽样调查数据推算获得,而之前的社会劳动者总量数据依据各单位报表合并方法获得,1990之前和之后的数据不具备经济分析上的可比性。
2.本文所采用数据指标包括GDP和就业人员的全国和省级总量数据、分产业的GDP和就业人员的全国和省级数据。其中,1997年以前各年各指标省级数据样本为29个,自1997年始各年各指标省级数据样本为30个。
3.1998年以后GDP总量及分产业的全国数据依《2006年中国统计年鉴》,即采用了2004年经济普查后的调整数据。1990~2000年,就业人员总计、城镇和乡村就业人员小计资料根据第五次全国人口普查资料重新调整,2001年及以后资料根据人口变动抽样调查资料推算。
4.1998年以后的各年各指标省级数据均采用各年《中国统计年鉴》公布数据,未采用根据2004年经济普查后的调整数据。其中,1990年分产业生产总值省级数据依《1991年中国统计年鉴》中的“各地区社会总产值”计算得到,1995年数据依《1997年中国统计年鉴》推算获得;1990,1992年分产业就业量省级数据依1991~1993年《中国统计年鉴》中的“各地区分行业社会劳动者人数”合并计算得到。
5.本文研究所使用的各类GDP数据均采用名义值,不进行平减指数调整。这样做的理论依据是Lucas的信息孤岛理论,即认为经济主体更多地是依据名义价格而不是实际价格进行行为调整。
四、测算结果及比较分析
在此,笔者先对基于固定影响的变截距模型所得计量结果进行分析,进而从方法论的角度将其同传统方法所得测算结果进行简要比较。
(一)实证结果分析
计量方程(2)的回归结果表明:西北区域的分产业和总量GDP就业弹性都是不显著的,华北和中南区域只有第二产业的回归结果是基本显著的,华东区域的第一、二产业的回归结果除个别年份都是显著的。基于此,笔者无法用加权平均的办法计算出全国的分产业就业弹性取值。但出于方法论探讨的目的,本文选择以华东地区第一和第二产业的就业弹性测算结果,对所建立的回归模型展开分析。
这样做的原因有三点:首先,华东地区是中国经济最为发达的地区,也是城市化最高的地区,这一地区的经济发展程度已经超越了刘易斯转折点,农村不再具有劳动力蓄水池的功能,因而对第一产业的分析是有意义的;其次,华东地区虽然不是中国的重工业集中地带,但作为最早的沿海开放地带,其制造业,尤其是轻工业的发展到了相当成熟的程度,因而有利于分析经济总量扩张对就业的结构效应;最后,中国第三产业的省级数据由于统计制度的原因,统计往往是不全面的,对其进行分析的数据基础比较薄弱,事实上,所有关于第三产业的区域回归分析结果绝大多数都是不显著的。
考虑到上述因素,笔者给出如表1所示的回归结果。
不难看出,表1所列数据具有明确的经济意义。首先,β1的取值全部为正,这说明某一产业自身规模的扩张必然吸纳更多的劳动力,这同新古典增长函数的内涵是完全相匹配的;其次,第一产业的结构效应系数全部为负,说明华东地区的确存在着持续的农业劳动力向二产和三产转移的过程,这同刘易斯的二元经济理论以及钱德勒大国模型的预言是完全相吻合的;第三,第二产业的结构效应系数有些年份为正,有些年份为负,这主要是由于政府大力推行积极就业战略,结构效应系数基本取正值,这一变动态势同华东地区第二产业的组成结构及历史演变也是相一致的。
上述分析表明,在数据基本可靠的前提下,基于方程(2)所回归的结果是可信的,统计意义和经济意义都是显著的,并且确实能有效地揭示就业弹性的变动特点,有效地区分和揭示经济总量扩张所具有的两种就业效应。这就证明,笔者提出的这一计量模型和计量方法是可信的。
(二)基于经济意义的比较分析
如前文所述,国内外学者采用不同方法对就业弹性的测算做了大量研究,如张车伟和蔡防(2002)、常进雄(2005)、吕民乐(2006),将他们的测算结果同本文的计算结果相比较,笔者发现,从经济演进的视角观察就业弹性的变动特点,能够揭示出若干新的结论:
1.观察表1中第一产业的规模效应、总量效应和结构效应数据序列,不难得出以下三个结论:(1)经济增长中农业就业的总量效应和结构效应表现为稳定的负值时间序列数据,这表明随着经济结构的不断演进,将会有越来越多的劳动力从农业转移到第二和第三产业中;(2)结构效应取值的绝对值是相当大的,平均取值在0.9左右,并呈现逐渐增大的势头,这表明随着经济的进一步发展,会有越来越多的劳动力从农业中转移出去;(3)规模效应的取值虽然为正值,但其平均值仅为0.45左右,并呈现逐渐减小的态势,这说明即使进一步扩大农业的生产规模,它所能吸收的劳动力数量也是有限的,而且吸纳力度会越来越小。
以上三点清晰地表明,农业的就业吸纳潜力是极为有限的。要解决剩余劳动力或隐性失业问题,只能依托二、三产业的发展,那种继续将农村和农业作为剩余劳动力蓄水池的做法是不符合经济发展要求的。
2.以往对第二产业就业弹性的测算结果均表明,第二产业的就业弹性这些年不断下降并出现负值。有些研究者据此认为,中国的第二产业已经出现了劳动排斥现象,继续推行重工业化战略只会加剧失业问题。笔者的测算结果表明,这一观点是有失偏颇的。事实上,第二产业的规模效应基本取正值,除极端年份外,这一取值还是很高的。这说明。扩大工业规模,加工业和重工业的加速发展依然是吸纳就业的有效途径。传统方法所测算出来的结果更多地体现了经济演进导致的产业结构转换效应,并不能由此认为第二产业存在劳动排斥现象。
责任编辑:学 诗
责任校对:涵 育
[作者简介]陆梦龙(1976—),男,北京人,中国社会科学院研究生院2005级在读博士生,研究方向为经济增长与失业。