论文部分内容阅读
摘 要:基于中国健康与营养调查2015年的横截面数据,采用倾向得分匹配的反事实因果分析方法,在考虑健康的选择性偏误的前提下,实证检验了健康风险冲击对劳动参与选择行为的影响。研究表明,健康风险冲击显著降低了劳动者继续工作的概率,但其净因果效应远低于其观测值之差。健康风险冲击对劳动参与决策的影响存在性别、城乡的差异,对女性的影响要高于男性,对农村劳动者的影响要高于城镇。劳动者带病坚持工作的比例居高不下,折射出劳动者健康保障制度的实际问题,建议健全就医期间的收入保障,降低休假治疗的时间机会成本。
关键词:健康风险;劳动参与;倾向得分匹配法;选择性偏差
中图分类号:F241.2
文献标识码:A 文章编号:1000-4149(2019)04-0030-17
DOI:10.3969/j.issn.1000-4149.2019.04.003
一、引言
美国经济学家西奥多·舒尔茨(Theodore W. Schultz)提出人力资本理论,并将其纳入现代经济增长理论分析,指出人力资本是有别于物质资本的另一种形式的资本,是促进经济增长的重要源泉。他所定义的人力资本包括教育、健康、培训和迁移等方面[1]。20世纪70年代教育回报率被提出后,教育人力资本得到众多学者关注,似乎教育成了人力资本的代名词,而健康人力资本难获研究者的青睐。但是作为衡量劳动者综合素质的指标,人力资本的内涵并不是单维的,它不仅包括教育,健康更是影响劳动者生产效率的重要指标。联合国开发计划署提出的人类发展指数(Human Development Index, HDI)中提出衡量一个国家的社会经济综合实力,不仅仅看GDP这一单一指标,预期寿命、婴幼儿死亡率等健康指标也是其发展的重要指标,且健康指标位列经济指标之前。联合国可持续发展目标提出的十七项目标中有三项直接和健康相关,两项间接与健康相关2015年9月联合国首脑会议上193个国家签署《联合国可持续发展目标》(Sustainable Development Goals,SDG),计划在2015—2030年实现社会、经济和环境等维度的17个发展目标。2016年10月国务院发布《“健康中国2030”规划纲要》,把提高健康素养水平上升到国家战略的层面,“健康中国”建设成为未来相当长一段时间内我国经济和社会建设方面的一项重要内容,健康优先的理念要求把健康融入所有的政策,对我国经济社会发展的结构和模式提出了更高的要求。因此,健康素养不仅仅是个人的事情,更是政府的责任。但是,不管是理论研究还是政策实践,在当前都还存在需要不断完善的地方,其主要原因集中在两方面:第一,在理论研究方面,健康数据难以获取,且存在较大的测量误差,健康的测度及健康概念的内涵和外延仍存在较大的争议。第二,从地方政府对健康投入的重视程度来看,经济投入明显不足,过往习惯的以GDP为目标的考核体系和向上负责的提拔任用制度,使得地方政府倾向于将财政资金投入见效快的基础设施建设,而对医疗卫生的投入捉襟见肘。正因为如此,研究健康对劳动力参与、劳动时间长短和劳动生产效率等劳动力供给的影响常常被忽视。
国内外已有一部分学者对健康与劳动力参与的关系进行了探索性研究,已有的研究都能够证明健康对劳动力参与有正面的促进作用,健康状况良好的劳动者其就业参与会明显提高。但是对如何解释这两者之间的因果关系尚存在较大的争议,争议的焦点主要集中在选择性偏误和内生性问题的解决上:由于在计量估计过程中健康与劳动力参与之间存在互为因果的关系,健康的测量存在误差,估计中存在遗漏变量(包括可测变量和不可测变量),这些选择性偏误的存在导致健康对劳动力供给影响的研究一度进展缓慢。随着计量经济学的发展,研究健康与劳动力参与的方法也在不断进步,从早期的OLS估计[2-4],发展到后来的Probit或logit估计模型[5-7]、联立方程模型[8-9]以及赫克曼(Heckman)两阶段估计模型[10-11]、倾向得分匹配模型[12]和因子分析法[13]。
以上众多方法的出现使得此方面的研究得以日益接近事实。
现有的研究存在以下不足:第一,没有较好地处理样本的选择性偏误问题。在引入一系列控制变量的条件下,直接将健康个体和非健康个体的劳动力参与情况进行比较,认为控制其他条件的情况下,回归结果报告的劳动力参与率之差,也就是健康风险对劳动力参与的因果关系。这忽视了健康资本存量低的个体更容易受到健康风险的冲击,患病率更高,样本基线组存在选择性偏误的问题,导致其估计的结果可能夸大了健康风险的冲击作用。第二,部分学者采用的数据质量可信度不高,不能满足健康人力资本研究的需要,存在一定的测量误差,导致其结果不可信。第三,健康风险对劳动力参与的冲击,应细分为短期冲击、中期冲击和长期冲击。短期冲击比如说是暫时性的患病,可能会请假休养,但不会马上退出劳动力市场;中期冲击比如说肥胖、营养不良等,短期内观察不到劳动参与率有较大的波动;长期冲击,如患有慢性病,或因年龄等其他原因导致的身体机能老化,导致工作、生活受限,长期冲击对劳动参与率的影响需要长时间的积累才可以观察到。
而以往的研究在此方面存在局限。
因此,非常有必要采用可信度更高的数据,以及采用更为合理的计量分析方法来补充现有的研究,真正找到健康风险冲击对劳动参与的净因果效应。首先,本文选取的中国健康和营养调查(CHNS)数据是美国北卡罗来纳大学教堂山分校和中国疾病控制和预防中心对中国家庭进行的入户调查,已经连续开展10次,国内外学者将该调查数据广泛应用于理论研究,其数据质量已得到同行认可。其次,本文选取四周内是否患病或受伤作为健康风险对就业参与的短期冲击,从短期内考察健康对劳动力参与的影响,由于劳动者接受短期冲击后,可能不会马上离开劳动力市场,因此本文选择是否就业作为劳动力参与的代理变量;为保证研究结论的稳健性,选取体质指数BMI作为中期健康风险冲击指标、患有慢性病的情况作为长期健康风险冲击指标进行稳健性检验,分析健康风险中期和长期冲击对劳动参与的影响,并与短期冲击进行比较和对照。再次,倾向得分匹配方法是通过构造一个反事实的分析框架,可以较大程度地降低选择性偏误,准确估计健康风险冲击对就业参与的净因果效应。本文以CHNS的2015年横截面数据为基础,以倾向得分匹配分析方法为基础构造一个反事实分析框架,最大程度地控制样本观察值的选择性偏误问题,以检验健康风险冲击对劳动参与的净影响,以期为健康人力资本的就业效应研究提供新证据。 二、理论基础
为了准确地估计健康风险冲击对是否就业的因果关系,本文借鉴罗森鲍姆与鲁宾(Rosenbaum and Rubin)的反事实分析框架[14],将样本随机地分为两组,第一组接受处理,接受健康风险冲击,即四周内患病;第二组不接受处理,不接受健康风险冲击。虚拟变量Di=1,0分别表示是否接受健康风险冲击,潜在产出YT、YC分别表示是否接受健康风险冲击的就业情况。如果个体i选择接受健康风险冲击,可以得到其冲击后的观察值YT1,但无法知晓其不接受冲击的潜在产出YC1;同理如果个体j选择不接受健康风险冲击,可以得到其观察值YC0,但同样无法知晓其接受冲击的潜在产出YT0(见表1)。可以通过假设个体i不接受健康冲击的产出YC1,本文称其为反事实的假设值;同理假设个体j 接受健康冲击的产出YT0,是个体j的反事实假设值。
本文的研究目标是个体接受健康风险冲击后,其就业意愿是否降低以及降低的程度,也即考察处理组在冲击前后
就业意愿的差距,本文定义为健康风险冲击的处理效应ATT。
要差,在不接受健康风险冲击的情况下,处理组样本工作意愿比控制组低,也就是说μ<0。由于E(δ)、μ、ATT均为负数,考察其绝对值数值大小,则|ATT|<|E(δ)|,也就是说真实的因果效应小于观察值之差。
由于存在选择性偏差使得直接利用观察值进行回归,得到的结果是有偏估计,解决的办法是通过随机实验的方式确保处理组和控制组在干预前是无差异的,但是随机实验并非都是可行的,考虑到成本、伦理或客观实际等条件的限制,并不符合进行随机实验的条件。在这种情况下,并不见得选择性偏差无法解决,罗森鲍姆和鲁宾
给选择性偏差提供了一个解决的思路[14],就是根据可观测到的既影响到处理变量,又影响到结果变量的因素,
将其定义为“混淆因素(confounding variables)”或“协变量(covariates)”
混淆因素或协变量是从不同角度来理解除处理变量以外的可观测变量。混淆因素,是因为这些可观测的因素会混淆处理变量对结果变量的因果效应,产生有偏估计;协变量是指这些因素在处理变量对结果变量的因果关系中起着协助作用。本文的健康风险冲击在劳动力参与影响的模型中,协变量指的就是年龄、性别、婚姻、受教育程度、家庭人均收入等因素。罗森鲍姆和鲁宾认为分组变量满足可忽略性假设(Ignorable Hypothesis),个体对分组情况Di取决于一系列的协变量Xi,那么潜在产出
三、数据来源、变量选取与描述性统计
1.数据来源
本文的数据来源于中国营养与健康调查数据(China Health and Nutrition Survey, CHNS),该数据
包括城镇和农村社区、家庭、个人等层面的数据,每年的调查样本超过8000个成人和儿童,有严格的抽样程序和标准,具有较好的权威性和代表性,为研究中国城乡家庭和个体的经济和社会问题提供了良好的微观数据支撑。
根据本文的研究需要,选取了最新的2015年横截面数据,借鉴国际上关于劳动参与率的年龄统计标准,选取15—64岁的城乡个体作为研究对象,共得到5395个样本,分别为1104个城镇女性、1598个农村女性、1049个城镇男性、1644个农村男性,其中城镇和农村的划分以户籍为依据。5395个总样本中的处理組样本,即四周内患病的个体为742个,控制组4653个。患病后有61.19%的个体选择继续工作,而不患病的控制组选择工作的比例为77.35%(见表2)。根据前面的理论分析,处理组和控制组的观察值之差E(δ)=[E(YTi|Di=1)-E(YCi|Di=0)]=61.19%-77.35%=-16.16%,即接受健康风险冲击和不接受的工作概率下降了16.16个百分点。但由于基准性偏误的存在,实际的因果效应比该数值要小。
2.变量选取
(1)处理变量与结果变量的选取。
本文选取的处理变量是健康风险短期冲击:四周内是否患病(been sick or injured in 4 weeks) CHNS的调查中还进一步调查了是否发烧、咳嗽、咽喉痛;腹泻;胃痛;哮喘;头痛、眩晕;关节、肌肉酸痛;皮疹、皮炎;眼、耳疾病;心脏病、心口痛;其他感染性疾病;其他非传染性疾病。选取四周内是否患病这一指标来衡量健康风险对就业的短期冲击,是因为身高、体重、BMI指数、血压等体测状况,反映的是健康资本的存量状况,是一种中长期冲击,对劳动参与的短期冲击并不明显。卡路里、碳水化合物、脂肪和蛋白质的摄取量等指标一般是衡量营养的相关指标,营养的摄取量会一定程度上影响到身体健康和发育,也使劳动者体力和精力得到补充,会直接影响到劳动者的产出水平,但对是否参与劳动的短期冲击并不大。健康的综合状态衡量包括因病对日常生活行为和工作受限的客观指标和自我健康评价的主观指标,自我健康评价指标往往会受到个人的主观偏见和其他社会经济学指标的干扰,在实证研究中的可信度较差。日常生活行为和工作受限指标较少受到主观偏见和其他因素的干扰,其构成需通过设计多维度的量表,并进行因子分析形成健康综合状态指标,由于样本量的限制,可能会出现数据稀疏的问题。因此本文选取了四周内是否患病作为短期健康风险冲击来研究其对劳动参与的影响。
本文选取的结果变量是:目前是否工作(presently working)。劳动者患病后,不同的个体因体质情况、家庭收入、患病的严重程度等差异,可能会坚持工作或暂时甚至永久离开工作岗位,对劳动参与决策影响较为明显且统计误差较小,但对劳动时间的影响存在较大的统计误差。如国内学者刘生龙、于大川等研究自评健康状况对劳动参与和劳动供给时间的影响时[15-16],由于劳动供给时间的数据收集和统计过程中存在较大的误差,导致估计存在一定的偏误。基于此,本文选取目前是否工作作为短期健康风险对劳动参与率影响的代理变量。 (2)匹配变量的选取。
借鉴早期的经验研究,选出既影响劳动参与选择,又影响健康状况的可观测因素作为PSM分析的匹配变量,主要包括年龄、性别、婚姻、受教育程度、是否从事技术或管理工作、工资等个人特征变量;家庭人均收入、家庭少儿照料等家庭特征变量;劳动者的城乡户籍,所在省、市、自治区等地区特征变量;是否购买医疗保险以及医疗保险的类别(包括城镇职工医疗保险、城镇居民医疗保险、新型农村合作医疗保险、其他医疗保险)等健康风险保障特征变量。
3.变量的描述性统计
本文中选取变量的描述性统计情况见表3,结果变量为目前是否工作,是二元选择变量,1表示就业,0表示非就业状态(可能失业或退出劳动力市场)。处理变量为四周内是否患病,是二元选择变量,1表示患病,0表示不患病。匹配变量中的年龄变量参照国际标准关于劳动参与率统计口径,选取15—64岁阶段人口样本。性别是二元选择变量,1表示男性,0表示女性。婚姻变量中将未婚、离异、独身、丧偶等情况合并为0,表示不在婚,1表示在婚。受教育年限变量中0表示文盲,1—6表示接受小学阶段的教育,7—9表示接受初中阶段的教育,10—12表示接受高中或中等技术学校的教育,13—18表示接受大学阶段的教育,19表示大学以上的教育。是否有医疗保险是二元选择变量,1表示参加医疗保险,0表示没有参加医疗保险,不区分购买哪一类型的医疗保险。
是否有6岁以下小孩需要照料,1表示有,0表示没有,不区分有几个小孩需要照料。家庭人均收入变量,既包括工资性收入,也包括非工资性收入,用家庭总收入除以总人口数得到。所在省份包括北京、辽宁、黑龙江、上海、江苏、山东、河南、湖北、湖南、广西、贵州、重庆等。城乡变量中用1表示城镇户口,0表示农村户口。
通过直接比较处理组和控制组的差异,初步发现:第一,患病后劳动参与率比非患病组要低16.16%,统计显著。从匹配变量来看,四周内患病群体的年龄显著要比非患病组高,患病组的男性比例显著低于非患病组,说明高龄、女性为易患病人群。第二,患病组的工资收入、家庭人均收入均显著高于非患病组;赚取更多的经济收入可能是患病后继续坚持工作的动因。第三,患病组有6岁以下小孩需要照顾的个体劳动参与率高于非患病组,直观上初步判断是因为家庭负担重,患病后不得不坚持继续劳动。第四,从参加的医保类别来看,患病组参与城镇职工医保和城镇居民医保的比例显著高于非患病组,但是患病组参与新型农村合作医疗保险的比例显著低于非患病组。总体上两个群体的参保率没有显著差异,但是考虑到城镇职工和城镇居民主要面向城镇人口,新型农村合作医疗面向农村人口,并结合患病组和非患病组的城乡差异,直观上可以判断两个群体存在明显的城乡差异。
四、实证分析
罗森鲍姆与鲁宾认为利用倾向得分匹配估计因果关系的平均处理效应的一般步骤为:首先,以处理变量为因变量,协变量为自变量建立Logistic模型对倾向得分值进行估计。其次,选用合适的匹配方法进行倾向得分值匹配,常用的匹配方法有最近邻匹配法(Nearest Neighbor Matching Method)、核匹配法(Kernel Matching Method)和半径匹配法(Radius Matching Method)[17]。本文分别报告了最近邻匹配、核匹配和半径匹配的估计结果,并和OLS回归、Probit估计进行比较。再次,根据匹配后的样本计算平均处理效应ATT。最后,对匹配的结果进行敏感性分析和稳健性检验。
1.四周内患病概率的Logistic估计
根据PSM方法的研究步骤,首先需要估计样本四周内患病的概率,以四周内是否患病作为因变量,以年龄、性别、婚姻、受教育程度、城乡、家庭人均收入、是否有6岁以下儿童需要照料、是否参加医疗保险等匹配变量为自变量进行Logistic回归,得到事件概率的估计值见表4。本文报告了Logistic模型的PseudoR2和AUC两个指标对模型的有效性进行诊断,其中PseudoR2是Logistic回归估计中常用的拟合优度评价指标,AUC是指受试者工作特征曲线(ROC)下方的面积值。由表4可知,PseudoR2为0.138,说明模型的拟合优度较好,AUC的估计值为0.772,接近于施蒂墨尔等(Sturmer et al) 建议的0.800的“阈值”[18]。说明模型选取的匹配变量符合平衡性标准要求。
2.匹配质量的评估
得到倾向得分后,需要对匹配的质量进行评估,以确保处理组和控制组在倾向得分上的相似性。匹配质量的评估包括两个方面:一是评估匹配前后距离偏差是否缩小;二是评估匹配后样本的损失情况。
匹配偏差的评估可以通过计算匹配后的处理组和控制组各协变量的标准化偏差来进行匹配的平衡性检验。倾向得分匹配的标准偏误的绝对值阈值一般选定为5%或10%,如果标准化偏差小于阈值,就可认为匹配通过平衡性检验,其匹配效果是良好的。从表5的匹配质量检验可以发现,除是否有6岁以下小孩需要照顾这一变量的标准化偏差绝对值大于5%,其他匹配变量的偏差绝对值都小于5%;是否有6岁以下小孩需要照顾的匹配后的偏差绝对值为6.4%,通过10%的阈值检验;因此,认为匹配变量的一对一匹配效果较好。
匹配后样本损失情况,可以通过寻找匹配变量的共同取值范围,根据倾向得分值进行再抽样,由于不是所有的样本都能找到匹配对象,有可能还是会出现样本损失的情况。通过基于倾向得分值对样本进行抽样匹配,使处理组和控制组在协变量上变得平衡,以更好地控制选择性偏误。从图1可以看出,大多数的匹配变量均在共同取值范围内,因此,倾向得分匹配损失的样本数是非常少的。
3.反事实估计结果比较
为了检验匹配结果的稳健性,本文分别采用最近邻匹配、核匹配和半径匹配的方法对处理组和控制组进行匹配,同时也对分样本(城乡、性别)进行估计以检验其异质性,并将匹配估计结果与OLS和Probit估计结果进行对比。从表6可以看出,通過匹配消除了处理组和控制组的选择性偏误后,四周内患病对劳动参与率有显著的影响,会显著降低劳动参与率,处理组匹配后的平均处理效应约为-5%,也就是说四周内患病会使劳动参与率下降5个百分点。OLS和Probit估计的结果明显偏大,比匹配方法的估计结果高出3%—4%,说明OLS和Probit估计仍存在一定的选择性偏误,导致估计结果存在误差。 在控制其他因素以后,健康风险对劳动参与的影响主要体现在农村和女性上,农村个体在患病后的劳动参与率下降7%左右,而城镇个体患病后的劳动参与率下降仅为3.5%,可能的原因是农村主要从事的是体力劳动,对身体条件的要求高,一旦患病对劳动参与率的影响要比城镇明显。女性在患病后劳动参与率下降6%左右,男性仅下降3.5%左右,可能的原因是女性的健康风险高,四周内患病率高,一旦患病对劳动参与率下降的影响比男性要大。
4.敏感性分析
倾向得分匹配是基于可忽略性假设前提下,依可测变量进行匹配来估计处理效应,是否存在既影响健康状况,又影响就业选择的不可观测变量影响匹配的结果呢?一旦存在,将会影响到模型的假设前提,甚至推翻其反事实分析框架。本文借鉴罗森鲍姆的敏感性分析方法进行检验
对经过倾向得分匹配后的结果变量(是否工作)进行敏感性检验,结果汇报见表7,发现随着Γ取值增大,其稳健性的P值变化很小,当Γ=2时,P=0.006,有99%的把握拒绝原假设,Rosenbaum敏感性检验显示不存在隐性偏差。
5.稳健性检验
健康风险冲击具有长期、中期、短期的阶段性,“四周内是否患病”仅从短期角度分析健康风险冲击对劳动参与的影响,为了确保分析结果的可靠性,有必要从中期和长期方面进一步估计健康风险冲击对劳动参与决策的影响。借鉴王建国、杨志海的研究思路选取营养摄取状况中的体质指数作为中期冲击、患有慢性病的情况作为长期冲击进行稳健性检验[19-20]。体质指数BMI是用体重(单位:kg)除以身高的平方(单位:m2)计算得到,按照世界卫生组织的界定标准,BMI指数小于18.5为偏瘦,大于25为偏胖,18.5—25为正常。CHNS数据中慢性病的调查主要是通过疾病史的询问获取,包括糖尿病、高血压、中风和骨折等,采用患慢性病个数的虚拟变量来反映长期健康冲击的有无和严重程度。
以体质指数正常为参照组,对偏瘦和偏胖个体分别进行PSM估计,协变量选取和四周内是否患病模型一致。表8报告的是中期健康冲击(体质指数)对劳动参与的影响,偏瘦体质对劳动参与的影响为负,但不显著;偏胖体质对劳动参与的影响为负,在1%的水平上显著。分样本估计中,肥胖的农村个体劳动参与下降的程度要比城镇高;女性肥胖个体对劳动参与率的下降程度要比男性高。随着经济水平的提升,营养不良带来的体重偏瘦现象较为少见,对劳动参与的影响并不显著,但肥胖体质的人口逐渐增多,体重偏胖的人群带来行动不方便,对从事的工作岗位类别有限制,使得劳动参与率下降;另外体重偏胖通常和心脑血管疾病、糖尿病等疾病有密切关系,带来较大的健康隐患,因而肥胖指数上升带来劳动参与率的明显下降。表8的估计结果和表6相比,偏胖体质的估计结果和四周内是否患病对劳动参与决策的影响基本是一致的,说明中期健康冲击与短期健康冲击对劳动参与决策的影响基本一致。
以没有患慢性病为参照组,对患一种慢性病和患两种及以上的慢性病人群分别进行倾向得分匹配估计,协变量的选取和四周内是否患病估计模型一致。表9报告的是长期健康冲击(患慢性病)对劳动参与决策的影响,患一种和患两种及以上慢性病对劳动参与率的影响均显著为负,农村个体患慢性病后劳动参与率的下降程度比城镇要明显,女性个体患慢性病后劳动参与率下降程度比男性明显,尤其是患两种及以上慢性病,全样本的劳动参与率下降65.92%,对照表3描述性统计中关于全样本劳动参与率的均值为75.13%可知,患有两种及以上慢性病的群体几乎接近要退出劳动力市场。表9关于是否患慢性病对劳动参与决策影响的估计结果和表6关于四周内是否患病对劳动参与的影响估计基本一致。
总结四周内是否患病、体质指数和患慢性病情况对劳动参与决策的估计结果,发现不管是短期、中期还是长期健康风险冲击,得到的结论基本是一致的:健康风险冲击对劳动参与有显著的负向影响,患有疾病或健康状况下降,会导致劳动参与率显著降低。
6.机制解释与进一步分析
倾向得分匹配方法估计出个体在患病后劳动参与率会明显降低,并且存在城乡、男女之间的差异性。那么健康风险如何影响劳动参与率?哪些措施可以平滑或降低健康风险呢?下面进一步分析患病的严重程度、患不同疾病对劳动参与率的影响;医疗保险参与情况和家庭收入高低对平滑健康风险的影响。本文通过比较城乡、男女居民在参保情况、家庭收入高低、患病情况等方面的差异性,试图找到平滑健康风险的措施,从而提高劳动参与率。
(1)患病的严重程度对劳动参与率影响的差异。针对四周内患病个体的劳动参与率情况进一步分析,将调查对象的自我感觉
患病严重程度分为“不严重”、“一般”、“严重”、“不知道”四个类别分别进行倾向得分匹配(以四周内不患病为参照),表10报告的是采用最近邻匹配方法的估计结果。不同的病情程度对劳动参与率的影响存在差异性,病情最严重的对劳动参与率影响最显著,其次是一般状况,轻微患病对劳动参与率的影响程度较小,不知道患病情况对劳动参与率影响不显著,说明如果轻微患病,个体坚持劳动的概率较大,对劳动参与几乎没有什么影响。
(2)患不同疾病对劳动参与影响的差异性。
针对四周内患病情况,进一步细化到底患的哪一类别的疾病,本文将疾病类别具体细分为“呼吸系统疾病”、“消化系统疾病”、“风湿类疾病”、“心血管类疾病”四类分别进行倾向得分匹配,表11报告的是采用最近邻匹配方法的估计结果。不同类型的疾病对劳动参与率的影响存在差异性,呼吸系统疾病的影响程度最小,其次是消化系统疾病,再次是风湿类疾病,心血管类疾病对劳动参与率影响最为严重。呼吸系统疾病包括感冒、发烧、咳嗽、哮喘等,患病后大多数个体可以继續坚持劳动;消化系统疾病包括胃疼、腹泻等,对健康的影响程度要比呼吸系统疾病严重,劳动参与率下降的程度也比呼吸系统高;风湿类疾病包括关节肌肉疼等,直接影响到个体的活动能力,对劳动的影响程度较大,劳动参与率的处理效应下降10.5%;心血管类疾病包括心脏病、胸痛等,对个体劳动能力影响最大,劳动参与率的处理效应下降18.6%。 (3)医疗保险对健康风险平滑机制的城乡差异解释。
由表12的数据可以计算出城镇样本的参保率为94.52%,而农村样本的参保率为97.19%。尽管农村的参保率略高于城镇,但由于城镇职工医疗保险和城镇居民医疗保险的补偿力度明显大于新型农村合作医疗保险,城镇个体对健康风险的平滑作用要大于农村,从而可以解释农村面对健康风险冲击其劳动参与率下降的程度要比城镇高。不管是城镇还是农村样本中,参加医疗保险的个体收入明显高于没有参加医疗保险的个体,经济收入越高的个体,参保率越高,对健康风险的平滑作用越大,健康风险对劳动参与的影响程度也就得到一定程度的缓解。
表13反映了不同参保情况、城乡个体的患病差异,已参保的对象中城镇个体比农村的四周内患病率高,但未参保对象中城镇个体的四周内患病率比农村低。结果一方面说明了参加医疗保险后,城镇个体健康风险意识增强,对医疗服务的利用率比农村高;另一方面,未参保对象中,农村个体的家庭收入较低,自身健康状况较差导致了四周内患病率高,而城镇中的未参保对象大多数是家庭收入较高,自身健康状况较好的个体,故四周内患病率低,这是基准性差异带来的影响。
的个体参加医疗保险的概率相对于农村更高,这些人有了医疗保险后,可以更为方便地利用医疗服务更好地平滑健康风险,减少其对劳动参与的影响;农村中的低收入、四周内患病率高的个体参加医疗保险的概率相对较低,使其无法获取更多的医疗服务,而农村中参加医疗保险的对象为收入较高且四周内患病率低的个体,这也是造成农村个体患病后劳动参与率下降的处理效应要比城镇个体影响更为显著的重要原因。
(4)医疗保障对健康风险平滑机制的性别差异解释。由表14的数据可以计算出男性样本的参保率为95.73%,女性样本参保率为96.52%,女性的参保率略高于男性。参保概率的差别会带来医疗服务利用的差异性,影响健康风险的平衡作用,从而影响劳动参与率的高低。在参保群体中,女性个体的收入低于男性,说明低收入的女性更多地参加了医疗保险,
但高收入的女性个体没有參加医疗保险的比例明显高于男性。
表15反映了不同参保情况、性别的四周内患病情况差异,在参保样本中,女性的四周内患病率明显高于男性;而在未参保样本中,女性的四周内患病率略高于男性,其差距并不明显。收入高的男性更可能参与了医疗保险,而这些参与医保的男性四周内患病率低于女性;收入高的女性倾向于不参与医疗保险,这些不参加医保的女性四周内患病率却高于男性。
女性、参与医疗保险的个体经济情况较差,对医疗卫生服务的利用程度低。四周内患病率高的女性参保率相对较低,患病后得不到补偿,无法平滑其健康风险,这也就是造成患病后女性的劳动参与率的下降程度比男性高的原因。五、结论与启示
本文利用倾向得分匹配的反事实分析框架,利用最近邻匹配、核匹配和半径匹配三种匹配方法解决了样本的选择性偏误问题,通过研究健康风险冲击对劳动参与率的影响,得出如下研究结论:①健康风险冲击会显著降低劳动者的就业意愿,但远低于观测值之差。②健康风险冲击对劳动参与率的影响存在城乡的差异,对农村个体的劳动参与率的降低程度大于城镇。③健康风险冲击对劳动参与率的影响存在性别差异,患病的女性个体的劳动参与率下降程度比男性要大。④与匹配分析得到的处理组的净平均处理效应相比,使用OLS和Probit估计方法会显著高估四周内患病率对劳动参与率的下降作用。⑤患病的严重程度对劳动参与率的影响有差异性,轻微患病、不知道患病程度的个体对劳动参与率下降的影响较小,患病严重者会带来劳动参与率的较大幅度的下降。⑥患病的类别对劳动参与率的影响有差异性,患呼吸系统疾病影响最小,消化系统疾病和风湿类疾病次之,心血管类疾病的影响最大。基于此,本文还对健康风险冲击影响劳动参与率的机制进行探究,主要是个体的健康资本存量、医疗卫生服务利用、医疗保险类别及补偿、家庭收入水平等方面存在的差异性,导致不同患病个体劳动参与率降低程度的差异。基于研究结论,本文有以下启示。
首先,我国劳动者在遭受健康风险冲击后坚持继续工作的比例仍比较高,意味着大部分劳动者是在牺牲自身健康资本存量下带病坚持劳动,该研究结论和谭娜、周先波发现的“无休止劳动”是一致的[21]。现阶段城乡劳动者带病坚持工作的比例仍居高不下,折射出劳动者健康保障制度的实际问题。在“健康中国”的战略需求下,医疗保障的设计理念已经不能应对老龄化、疾病普遍化的挑战,需要向更高水平、更综合的健康保障发展理念转变。健康保障不仅仅是保障有病可医,更应负责劳动者在休假治疗期间的收入保障,在特定的情况下给予物质或资金的帮助,用以保障公民的健康权益,否则会出现劳动者因工作负荷、就医时间的机会成本过高,从而健康状况进一步恶化,并形成恶性循环,最终影响劳动者的就业参与和劳动生产效率的情况。
其次,健康需求和实际获得存在不匹配和非均衡。本文的研究结论显示男性和女性个体患病后对劳动参与的影响具有明显的差异,说明女性的健康需求比男性要强,但实际的健康服务却没有明显的差异,导致对劳动参与的影响要比男性要强。在农村,经济收入低、四周内患病率高的个体健康需求高,但实际的健康服务却较难获得,导致农村个体患病后对劳动参与的下降程度要比城镇明显。由此可见,医疗服务需求与实际获得之间存在不匹配和非均衡。党的十九大报告指出,新时代的社会主要矛盾已经转化为人民日益增长的美好生活需要和不平衡、不充分的发展之间的矛盾,而健康作为促进人的全面发展的必然需求,是最普遍意义的民生需求,也是美好生活最重要、最基本的需求。“健康中国”的发展理念追求的是全人群和全生命周期的健康服务,追求的不仅仅是“治病”,更是“治未病”,健康领域的发展理念要从“以治疗为中心”向“以预防为中心”转变、向促进全人群和全生命周期的“全面健康”发展目标迈进。
再次,医疗保险制度设计存在选择性和非均衡性。我国的基本医疗保障体系包括城镇职工医疗保险、城镇居民医疗保险、新型农村合作医疗保险和城乡医疗救助,城镇居民和新型农村合作医疗保险覆盖的人群最广,保障机制的设计存在一定的自选择性,参保是自由选择,居民是在考虑其自身健康需求和保费支付能力的前提下作出的参保决定,在面对健康服务费用支付方面采用分摊制,一定程度上会抑制低收入群体的参保意愿和医疗服务的利用率。低收入者容易陷入“健康条件差——劳动参与率低——获取经济收入低——参保能力低——医疗服务利用率——健康需求得不到满足”的恶性循环。健康权是公民享有的基本权利,全民基本医疗保险制度是对公民健康权益保障的制度化体现,由于设计上的差异导致低收入群体的医疗保险利用效率低下,显著降低了制度的公平性,也降低了制度的效率,对“健康中国”建设带来了负面影响。“健康中国”建设提出建立覆盖全民的医保制度,不仅仅是医疗保险的投保覆盖率达标,更重要的是“每个人当他需要时就能以支付得起的价格获得各种适宜的卫生保健”,要注重医疗保险利用效率的公平性,重点关注老年人、妇女儿童、贫困人口等弱势群体,降低起付线,增加门诊报销比例,真正构建起一个普惠型的全面医疗保障体系。 参考文献:
[1]SCHULTZ T W. Human resources human capital: policy issues and research opportunities [M]. New York: National Bureau of Economic Research,1972:176-193.
[2]LUFT S H. The impact of poor health on earnings[J]. The Review of Economics and Statitics, 1975,57(1):42-57.
[3]BENHAM L A. Employment earnings and psychiatric diagnosis[M].
FUCHS VR. Economic Aspects of Health. Chicago: The University of Chichago Press, 1982:203-220.
[4]都陽. 中国贫困地区农户劳动供给研究[M]. 北京:华文出版社,2001:105-124.
[5]樊明.健康经济学:健康对劳动力市场表现的影响[M].北京:社会科学文献出版社,2002:116-135.
[6]刘生龙. 健康对农村居民劳动力参与的影响[J]. 中国农村经济,2008(8):25-33.
[7]于大川,赵小仕. 健康对农民劳动参与的影响:基于CHNS数据的实证研究[J]. 农业现代化研究,2015,36(6):1038-1043.
[8]田艳芳. 中国中老年人的健康状况对劳动参与的影响[J]. 山西财经大学学报,2010(3):1-7.
[9]ETTNER S L, FRANK R G, RONALD C K. The impact of psychiatric disorders on labor market outcomes[J]. Industrial and Labor Relations Reviews, 1997, 51(1): 64-81.
[10]SCHULTZ T P, TANSEL A. Measurement of return to adult health: morbidity effects on wage rates in Cote d’lvoire and Ghana[R].
Living Standards Measurement Study Working Paper, 1992.
[11]曹乾,杜雯雯.健康的就业效应与收入效应:基于Heckman模型的检验[J].经济问题探索,2010(1):134-138.
[12]任兆璋,范闽. 健康对劳动参与的多值政策效应分析[J].广东社会科学,2006(1):38-43.
[13]魏众. 健康对非农就业及其工资决定的影响[J]. 经济研究,2004(2):64-74.
[14]ROSENBAUM P R, RUBIN D B. The central role of the propensity score in observational studies for causal effects[J]. Biometrica, 1983,70(2):41-55.
[15]刘生龙. 健康对农村居民劳动力参与的影响[J]. 中国农村经济,2008(8):25-33.
[16]于大川.更好的营养会促进农民的劳动参与吗?[J].西部论坛,2016(1):10-18.
[17]ROSENBAUM P R. Observational studies[M]. New York: Springer, 2002: 65-78.
[18]STURMER T, JOSHI M, GLYNN R J. A review of the application of propensity score methods yielded increasing use, advantages in specific settings, but not substantially different estimates compared with conventional multivariable methods[J]. Journal of Clinical Epidemiology, 2006, 5: 9-12.
[19]王建国. 中国居民健康对劳动参与的影响——基于多维健康指标的实证分析[J].北京科技大学学报(社会科学版),2011(1):104-110.
[20]杨志海,麦尔旦· 吐尔孙,王雅鹏. 健康冲击对农村中老年人农业劳动供给的影响——基于CHARLS数据的实证分析[J].中国农村观察,2015(3):24-37.
[21]谭娜,周先波.中国农村老年人“无休止劳动”存在吗?——基于年龄和健康对劳动供给时间影响的研究[J].经济评论,2013(2):19-29.
[责任编辑 刘爱华,方 志]
关键词:健康风险;劳动参与;倾向得分匹配法;选择性偏差
中图分类号:F241.2
文献标识码:A 文章编号:1000-4149(2019)04-0030-17
DOI:10.3969/j.issn.1000-4149.2019.04.003
一、引言
美国经济学家西奥多·舒尔茨(Theodore W. Schultz)提出人力资本理论,并将其纳入现代经济增长理论分析,指出人力资本是有别于物质资本的另一种形式的资本,是促进经济增长的重要源泉。他所定义的人力资本包括教育、健康、培训和迁移等方面[1]。20世纪70年代教育回报率被提出后,教育人力资本得到众多学者关注,似乎教育成了人力资本的代名词,而健康人力资本难获研究者的青睐。但是作为衡量劳动者综合素质的指标,人力资本的内涵并不是单维的,它不仅包括教育,健康更是影响劳动者生产效率的重要指标。联合国开发计划署提出的人类发展指数(Human Development Index, HDI)中提出衡量一个国家的社会经济综合实力,不仅仅看GDP这一单一指标,预期寿命、婴幼儿死亡率等健康指标也是其发展的重要指标,且健康指标位列经济指标之前。联合国可持续发展目标提出的十七项目标中有三项直接和健康相关,两项间接与健康相关2015年9月联合国首脑会议上193个国家签署《联合国可持续发展目标》(Sustainable Development Goals,SDG),计划在2015—2030年实现社会、经济和环境等维度的17个发展目标。2016年10月国务院发布《“健康中国2030”规划纲要》,把提高健康素养水平上升到国家战略的层面,“健康中国”建设成为未来相当长一段时间内我国经济和社会建设方面的一项重要内容,健康优先的理念要求把健康融入所有的政策,对我国经济社会发展的结构和模式提出了更高的要求。因此,健康素养不仅仅是个人的事情,更是政府的责任。但是,不管是理论研究还是政策实践,在当前都还存在需要不断完善的地方,其主要原因集中在两方面:第一,在理论研究方面,健康数据难以获取,且存在较大的测量误差,健康的测度及健康概念的内涵和外延仍存在较大的争议。第二,从地方政府对健康投入的重视程度来看,经济投入明显不足,过往习惯的以GDP为目标的考核体系和向上负责的提拔任用制度,使得地方政府倾向于将财政资金投入见效快的基础设施建设,而对医疗卫生的投入捉襟见肘。正因为如此,研究健康对劳动力参与、劳动时间长短和劳动生产效率等劳动力供给的影响常常被忽视。
国内外已有一部分学者对健康与劳动力参与的关系进行了探索性研究,已有的研究都能够证明健康对劳动力参与有正面的促进作用,健康状况良好的劳动者其就业参与会明显提高。但是对如何解释这两者之间的因果关系尚存在较大的争议,争议的焦点主要集中在选择性偏误和内生性问题的解决上:由于在计量估计过程中健康与劳动力参与之间存在互为因果的关系,健康的测量存在误差,估计中存在遗漏变量(包括可测变量和不可测变量),这些选择性偏误的存在导致健康对劳动力供给影响的研究一度进展缓慢。随着计量经济学的发展,研究健康与劳动力参与的方法也在不断进步,从早期的OLS估计[2-4],发展到后来的Probit或logit估计模型[5-7]、联立方程模型[8-9]以及赫克曼(Heckman)两阶段估计模型[10-11]、倾向得分匹配模型[12]和因子分析法[13]。
以上众多方法的出现使得此方面的研究得以日益接近事实。
现有的研究存在以下不足:第一,没有较好地处理样本的选择性偏误问题。在引入一系列控制变量的条件下,直接将健康个体和非健康个体的劳动力参与情况进行比较,认为控制其他条件的情况下,回归结果报告的劳动力参与率之差,也就是健康风险对劳动力参与的因果关系。这忽视了健康资本存量低的个体更容易受到健康风险的冲击,患病率更高,样本基线组存在选择性偏误的问题,导致其估计的结果可能夸大了健康风险的冲击作用。第二,部分学者采用的数据质量可信度不高,不能满足健康人力资本研究的需要,存在一定的测量误差,导致其结果不可信。第三,健康风险对劳动力参与的冲击,应细分为短期冲击、中期冲击和长期冲击。短期冲击比如说是暫时性的患病,可能会请假休养,但不会马上退出劳动力市场;中期冲击比如说肥胖、营养不良等,短期内观察不到劳动参与率有较大的波动;长期冲击,如患有慢性病,或因年龄等其他原因导致的身体机能老化,导致工作、生活受限,长期冲击对劳动参与率的影响需要长时间的积累才可以观察到。
而以往的研究在此方面存在局限。
因此,非常有必要采用可信度更高的数据,以及采用更为合理的计量分析方法来补充现有的研究,真正找到健康风险冲击对劳动参与的净因果效应。首先,本文选取的中国健康和营养调查(CHNS)数据是美国北卡罗来纳大学教堂山分校和中国疾病控制和预防中心对中国家庭进行的入户调查,已经连续开展10次,国内外学者将该调查数据广泛应用于理论研究,其数据质量已得到同行认可。其次,本文选取四周内是否患病或受伤作为健康风险对就业参与的短期冲击,从短期内考察健康对劳动力参与的影响,由于劳动者接受短期冲击后,可能不会马上离开劳动力市场,因此本文选择是否就业作为劳动力参与的代理变量;为保证研究结论的稳健性,选取体质指数BMI作为中期健康风险冲击指标、患有慢性病的情况作为长期健康风险冲击指标进行稳健性检验,分析健康风险中期和长期冲击对劳动参与的影响,并与短期冲击进行比较和对照。再次,倾向得分匹配方法是通过构造一个反事实的分析框架,可以较大程度地降低选择性偏误,准确估计健康风险冲击对就业参与的净因果效应。本文以CHNS的2015年横截面数据为基础,以倾向得分匹配分析方法为基础构造一个反事实分析框架,最大程度地控制样本观察值的选择性偏误问题,以检验健康风险冲击对劳动参与的净影响,以期为健康人力资本的就业效应研究提供新证据。 二、理论基础
为了准确地估计健康风险冲击对是否就业的因果关系,本文借鉴罗森鲍姆与鲁宾(Rosenbaum and Rubin)的反事实分析框架[14],将样本随机地分为两组,第一组接受处理,接受健康风险冲击,即四周内患病;第二组不接受处理,不接受健康风险冲击。虚拟变量Di=1,0分别表示是否接受健康风险冲击,潜在产出YT、YC分别表示是否接受健康风险冲击的就业情况。如果个体i选择接受健康风险冲击,可以得到其冲击后的观察值YT1,但无法知晓其不接受冲击的潜在产出YC1;同理如果个体j选择不接受健康风险冲击,可以得到其观察值YC0,但同样无法知晓其接受冲击的潜在产出YT0(见表1)。可以通过假设个体i不接受健康冲击的产出YC1,本文称其为反事实的假设值;同理假设个体j 接受健康冲击的产出YT0,是个体j的反事实假设值。
本文的研究目标是个体接受健康风险冲击后,其就业意愿是否降低以及降低的程度,也即考察处理组在冲击前后
就业意愿的差距,本文定义为健康风险冲击的处理效应ATT。
要差,在不接受健康风险冲击的情况下,处理组样本工作意愿比控制组低,也就是说μ<0。由于E(δ)、μ、ATT均为负数,考察其绝对值数值大小,则|ATT|<|E(δ)|,也就是说真实的因果效应小于观察值之差。
由于存在选择性偏差使得直接利用观察值进行回归,得到的结果是有偏估计,解决的办法是通过随机实验的方式确保处理组和控制组在干预前是无差异的,但是随机实验并非都是可行的,考虑到成本、伦理或客观实际等条件的限制,并不符合进行随机实验的条件。在这种情况下,并不见得选择性偏差无法解决,罗森鲍姆和鲁宾
给选择性偏差提供了一个解决的思路[14],就是根据可观测到的既影响到处理变量,又影响到结果变量的因素,
将其定义为“混淆因素(confounding variables)”或“协变量(covariates)”
混淆因素或协变量是从不同角度来理解除处理变量以外的可观测变量。混淆因素,是因为这些可观测的因素会混淆处理变量对结果变量的因果效应,产生有偏估计;协变量是指这些因素在处理变量对结果变量的因果关系中起着协助作用。本文的健康风险冲击在劳动力参与影响的模型中,协变量指的就是年龄、性别、婚姻、受教育程度、家庭人均收入等因素。罗森鲍姆和鲁宾认为分组变量满足可忽略性假设(Ignorable Hypothesis),个体对分组情况Di取决于一系列的协变量Xi,那么潜在产出
三、数据来源、变量选取与描述性统计
1.数据来源
本文的数据来源于中国营养与健康调查数据(China Health and Nutrition Survey, CHNS),该数据
包括城镇和农村社区、家庭、个人等层面的数据,每年的调查样本超过8000个成人和儿童,有严格的抽样程序和标准,具有较好的权威性和代表性,为研究中国城乡家庭和个体的经济和社会问题提供了良好的微观数据支撑。
根据本文的研究需要,选取了最新的2015年横截面数据,借鉴国际上关于劳动参与率的年龄统计标准,选取15—64岁的城乡个体作为研究对象,共得到5395个样本,分别为1104个城镇女性、1598个农村女性、1049个城镇男性、1644个农村男性,其中城镇和农村的划分以户籍为依据。5395个总样本中的处理組样本,即四周内患病的个体为742个,控制组4653个。患病后有61.19%的个体选择继续工作,而不患病的控制组选择工作的比例为77.35%(见表2)。根据前面的理论分析,处理组和控制组的观察值之差E(δ)=[E(YTi|Di=1)-E(YCi|Di=0)]=61.19%-77.35%=-16.16%,即接受健康风险冲击和不接受的工作概率下降了16.16个百分点。但由于基准性偏误的存在,实际的因果效应比该数值要小。
2.变量选取
(1)处理变量与结果变量的选取。
本文选取的处理变量是健康风险短期冲击:四周内是否患病(been sick or injured in 4 weeks) CHNS的调查中还进一步调查了是否发烧、咳嗽、咽喉痛;腹泻;胃痛;哮喘;头痛、眩晕;关节、肌肉酸痛;皮疹、皮炎;眼、耳疾病;心脏病、心口痛;其他感染性疾病;其他非传染性疾病。选取四周内是否患病这一指标来衡量健康风险对就业的短期冲击,是因为身高、体重、BMI指数、血压等体测状况,反映的是健康资本的存量状况,是一种中长期冲击,对劳动参与的短期冲击并不明显。卡路里、碳水化合物、脂肪和蛋白质的摄取量等指标一般是衡量营养的相关指标,营养的摄取量会一定程度上影响到身体健康和发育,也使劳动者体力和精力得到补充,会直接影响到劳动者的产出水平,但对是否参与劳动的短期冲击并不大。健康的综合状态衡量包括因病对日常生活行为和工作受限的客观指标和自我健康评价的主观指标,自我健康评价指标往往会受到个人的主观偏见和其他社会经济学指标的干扰,在实证研究中的可信度较差。日常生活行为和工作受限指标较少受到主观偏见和其他因素的干扰,其构成需通过设计多维度的量表,并进行因子分析形成健康综合状态指标,由于样本量的限制,可能会出现数据稀疏的问题。因此本文选取了四周内是否患病作为短期健康风险冲击来研究其对劳动参与的影响。
本文选取的结果变量是:目前是否工作(presently working)。劳动者患病后,不同的个体因体质情况、家庭收入、患病的严重程度等差异,可能会坚持工作或暂时甚至永久离开工作岗位,对劳动参与决策影响较为明显且统计误差较小,但对劳动时间的影响存在较大的统计误差。如国内学者刘生龙、于大川等研究自评健康状况对劳动参与和劳动供给时间的影响时[15-16],由于劳动供给时间的数据收集和统计过程中存在较大的误差,导致估计存在一定的偏误。基于此,本文选取目前是否工作作为短期健康风险对劳动参与率影响的代理变量。 (2)匹配变量的选取。
借鉴早期的经验研究,选出既影响劳动参与选择,又影响健康状况的可观测因素作为PSM分析的匹配变量,主要包括年龄、性别、婚姻、受教育程度、是否从事技术或管理工作、工资等个人特征变量;家庭人均收入、家庭少儿照料等家庭特征变量;劳动者的城乡户籍,所在省、市、自治区等地区特征变量;是否购买医疗保险以及医疗保险的类别(包括城镇职工医疗保险、城镇居民医疗保险、新型农村合作医疗保险、其他医疗保险)等健康风险保障特征变量。
3.变量的描述性统计
本文中选取变量的描述性统计情况见表3,结果变量为目前是否工作,是二元选择变量,1表示就业,0表示非就业状态(可能失业或退出劳动力市场)。处理变量为四周内是否患病,是二元选择变量,1表示患病,0表示不患病。匹配变量中的年龄变量参照国际标准关于劳动参与率统计口径,选取15—64岁阶段人口样本。性别是二元选择变量,1表示男性,0表示女性。婚姻变量中将未婚、离异、独身、丧偶等情况合并为0,表示不在婚,1表示在婚。受教育年限变量中0表示文盲,1—6表示接受小学阶段的教育,7—9表示接受初中阶段的教育,10—12表示接受高中或中等技术学校的教育,13—18表示接受大学阶段的教育,19表示大学以上的教育。是否有医疗保险是二元选择变量,1表示参加医疗保险,0表示没有参加医疗保险,不区分购买哪一类型的医疗保险。
是否有6岁以下小孩需要照料,1表示有,0表示没有,不区分有几个小孩需要照料。家庭人均收入变量,既包括工资性收入,也包括非工资性收入,用家庭总收入除以总人口数得到。所在省份包括北京、辽宁、黑龙江、上海、江苏、山东、河南、湖北、湖南、广西、贵州、重庆等。城乡变量中用1表示城镇户口,0表示农村户口。
通过直接比较处理组和控制组的差异,初步发现:第一,患病后劳动参与率比非患病组要低16.16%,统计显著。从匹配变量来看,四周内患病群体的年龄显著要比非患病组高,患病组的男性比例显著低于非患病组,说明高龄、女性为易患病人群。第二,患病组的工资收入、家庭人均收入均显著高于非患病组;赚取更多的经济收入可能是患病后继续坚持工作的动因。第三,患病组有6岁以下小孩需要照顾的个体劳动参与率高于非患病组,直观上初步判断是因为家庭负担重,患病后不得不坚持继续劳动。第四,从参加的医保类别来看,患病组参与城镇职工医保和城镇居民医保的比例显著高于非患病组,但是患病组参与新型农村合作医疗保险的比例显著低于非患病组。总体上两个群体的参保率没有显著差异,但是考虑到城镇职工和城镇居民主要面向城镇人口,新型农村合作医疗面向农村人口,并结合患病组和非患病组的城乡差异,直观上可以判断两个群体存在明显的城乡差异。
四、实证分析
罗森鲍姆与鲁宾认为利用倾向得分匹配估计因果关系的平均处理效应的一般步骤为:首先,以处理变量为因变量,协变量为自变量建立Logistic模型对倾向得分值进行估计。其次,选用合适的匹配方法进行倾向得分值匹配,常用的匹配方法有最近邻匹配法(Nearest Neighbor Matching Method)、核匹配法(Kernel Matching Method)和半径匹配法(Radius Matching Method)[17]。本文分别报告了最近邻匹配、核匹配和半径匹配的估计结果,并和OLS回归、Probit估计进行比较。再次,根据匹配后的样本计算平均处理效应ATT。最后,对匹配的结果进行敏感性分析和稳健性检验。
1.四周内患病概率的Logistic估计
根据PSM方法的研究步骤,首先需要估计样本四周内患病的概率,以四周内是否患病作为因变量,以年龄、性别、婚姻、受教育程度、城乡、家庭人均收入、是否有6岁以下儿童需要照料、是否参加医疗保险等匹配变量为自变量进行Logistic回归,得到事件概率的估计值见表4。本文报告了Logistic模型的PseudoR2和AUC两个指标对模型的有效性进行诊断,其中PseudoR2是Logistic回归估计中常用的拟合优度评价指标,AUC是指受试者工作特征曲线(ROC)下方的面积值。由表4可知,PseudoR2为0.138,说明模型的拟合优度较好,AUC的估计值为0.772,接近于施蒂墨尔等(Sturmer et al) 建议的0.800的“阈值”[18]。说明模型选取的匹配变量符合平衡性标准要求。
2.匹配质量的评估
得到倾向得分后,需要对匹配的质量进行评估,以确保处理组和控制组在倾向得分上的相似性。匹配质量的评估包括两个方面:一是评估匹配前后距离偏差是否缩小;二是评估匹配后样本的损失情况。
匹配偏差的评估可以通过计算匹配后的处理组和控制组各协变量的标准化偏差来进行匹配的平衡性检验。倾向得分匹配的标准偏误的绝对值阈值一般选定为5%或10%,如果标准化偏差小于阈值,就可认为匹配通过平衡性检验,其匹配效果是良好的。从表5的匹配质量检验可以发现,除是否有6岁以下小孩需要照顾这一变量的标准化偏差绝对值大于5%,其他匹配变量的偏差绝对值都小于5%;是否有6岁以下小孩需要照顾的匹配后的偏差绝对值为6.4%,通过10%的阈值检验;因此,认为匹配变量的一对一匹配效果较好。
匹配后样本损失情况,可以通过寻找匹配变量的共同取值范围,根据倾向得分值进行再抽样,由于不是所有的样本都能找到匹配对象,有可能还是会出现样本损失的情况。通过基于倾向得分值对样本进行抽样匹配,使处理组和控制组在协变量上变得平衡,以更好地控制选择性偏误。从图1可以看出,大多数的匹配变量均在共同取值范围内,因此,倾向得分匹配损失的样本数是非常少的。
3.反事实估计结果比较
为了检验匹配结果的稳健性,本文分别采用最近邻匹配、核匹配和半径匹配的方法对处理组和控制组进行匹配,同时也对分样本(城乡、性别)进行估计以检验其异质性,并将匹配估计结果与OLS和Probit估计结果进行对比。从表6可以看出,通過匹配消除了处理组和控制组的选择性偏误后,四周内患病对劳动参与率有显著的影响,会显著降低劳动参与率,处理组匹配后的平均处理效应约为-5%,也就是说四周内患病会使劳动参与率下降5个百分点。OLS和Probit估计的结果明显偏大,比匹配方法的估计结果高出3%—4%,说明OLS和Probit估计仍存在一定的选择性偏误,导致估计结果存在误差。 在控制其他因素以后,健康风险对劳动参与的影响主要体现在农村和女性上,农村个体在患病后的劳动参与率下降7%左右,而城镇个体患病后的劳动参与率下降仅为3.5%,可能的原因是农村主要从事的是体力劳动,对身体条件的要求高,一旦患病对劳动参与率的影响要比城镇明显。女性在患病后劳动参与率下降6%左右,男性仅下降3.5%左右,可能的原因是女性的健康风险高,四周内患病率高,一旦患病对劳动参与率下降的影响比男性要大。
4.敏感性分析
倾向得分匹配是基于可忽略性假设前提下,依可测变量进行匹配来估计处理效应,是否存在既影响健康状况,又影响就业选择的不可观测变量影响匹配的结果呢?一旦存在,将会影响到模型的假设前提,甚至推翻其反事实分析框架。本文借鉴罗森鲍姆的敏感性分析方法进行检验
对经过倾向得分匹配后的结果变量(是否工作)进行敏感性检验,结果汇报见表7,发现随着Γ取值增大,其稳健性的P值变化很小,当Γ=2时,P=0.006,有99%的把握拒绝原假设,Rosenbaum敏感性检验显示不存在隐性偏差。
5.稳健性检验
健康风险冲击具有长期、中期、短期的阶段性,“四周内是否患病”仅从短期角度分析健康风险冲击对劳动参与的影响,为了确保分析结果的可靠性,有必要从中期和长期方面进一步估计健康风险冲击对劳动参与决策的影响。借鉴王建国、杨志海的研究思路选取营养摄取状况中的体质指数作为中期冲击、患有慢性病的情况作为长期冲击进行稳健性检验[19-20]。体质指数BMI是用体重(单位:kg)除以身高的平方(单位:m2)计算得到,按照世界卫生组织的界定标准,BMI指数小于18.5为偏瘦,大于25为偏胖,18.5—25为正常。CHNS数据中慢性病的调查主要是通过疾病史的询问获取,包括糖尿病、高血压、中风和骨折等,采用患慢性病个数的虚拟变量来反映长期健康冲击的有无和严重程度。
以体质指数正常为参照组,对偏瘦和偏胖个体分别进行PSM估计,协变量选取和四周内是否患病模型一致。表8报告的是中期健康冲击(体质指数)对劳动参与的影响,偏瘦体质对劳动参与的影响为负,但不显著;偏胖体质对劳动参与的影响为负,在1%的水平上显著。分样本估计中,肥胖的农村个体劳动参与下降的程度要比城镇高;女性肥胖个体对劳动参与率的下降程度要比男性高。随着经济水平的提升,营养不良带来的体重偏瘦现象较为少见,对劳动参与的影响并不显著,但肥胖体质的人口逐渐增多,体重偏胖的人群带来行动不方便,对从事的工作岗位类别有限制,使得劳动参与率下降;另外体重偏胖通常和心脑血管疾病、糖尿病等疾病有密切关系,带来较大的健康隐患,因而肥胖指数上升带来劳动参与率的明显下降。表8的估计结果和表6相比,偏胖体质的估计结果和四周内是否患病对劳动参与决策的影响基本是一致的,说明中期健康冲击与短期健康冲击对劳动参与决策的影响基本一致。
以没有患慢性病为参照组,对患一种慢性病和患两种及以上的慢性病人群分别进行倾向得分匹配估计,协变量的选取和四周内是否患病估计模型一致。表9报告的是长期健康冲击(患慢性病)对劳动参与决策的影响,患一种和患两种及以上慢性病对劳动参与率的影响均显著为负,农村个体患慢性病后劳动参与率的下降程度比城镇要明显,女性个体患慢性病后劳动参与率下降程度比男性明显,尤其是患两种及以上慢性病,全样本的劳动参与率下降65.92%,对照表3描述性统计中关于全样本劳动参与率的均值为75.13%可知,患有两种及以上慢性病的群体几乎接近要退出劳动力市场。表9关于是否患慢性病对劳动参与决策影响的估计结果和表6关于四周内是否患病对劳动参与的影响估计基本一致。
总结四周内是否患病、体质指数和患慢性病情况对劳动参与决策的估计结果,发现不管是短期、中期还是长期健康风险冲击,得到的结论基本是一致的:健康风险冲击对劳动参与有显著的负向影响,患有疾病或健康状况下降,会导致劳动参与率显著降低。
6.机制解释与进一步分析
倾向得分匹配方法估计出个体在患病后劳动参与率会明显降低,并且存在城乡、男女之间的差异性。那么健康风险如何影响劳动参与率?哪些措施可以平滑或降低健康风险呢?下面进一步分析患病的严重程度、患不同疾病对劳动参与率的影响;医疗保险参与情况和家庭收入高低对平滑健康风险的影响。本文通过比较城乡、男女居民在参保情况、家庭收入高低、患病情况等方面的差异性,试图找到平滑健康风险的措施,从而提高劳动参与率。
(1)患病的严重程度对劳动参与率影响的差异。针对四周内患病个体的劳动参与率情况进一步分析,将调查对象的自我感觉
患病严重程度分为“不严重”、“一般”、“严重”、“不知道”四个类别分别进行倾向得分匹配(以四周内不患病为参照),表10报告的是采用最近邻匹配方法的估计结果。不同的病情程度对劳动参与率的影响存在差异性,病情最严重的对劳动参与率影响最显著,其次是一般状况,轻微患病对劳动参与率的影响程度较小,不知道患病情况对劳动参与率影响不显著,说明如果轻微患病,个体坚持劳动的概率较大,对劳动参与几乎没有什么影响。
(2)患不同疾病对劳动参与影响的差异性。
针对四周内患病情况,进一步细化到底患的哪一类别的疾病,本文将疾病类别具体细分为“呼吸系统疾病”、“消化系统疾病”、“风湿类疾病”、“心血管类疾病”四类分别进行倾向得分匹配,表11报告的是采用最近邻匹配方法的估计结果。不同类型的疾病对劳动参与率的影响存在差异性,呼吸系统疾病的影响程度最小,其次是消化系统疾病,再次是风湿类疾病,心血管类疾病对劳动参与率影响最为严重。呼吸系统疾病包括感冒、发烧、咳嗽、哮喘等,患病后大多数个体可以继續坚持劳动;消化系统疾病包括胃疼、腹泻等,对健康的影响程度要比呼吸系统疾病严重,劳动参与率下降的程度也比呼吸系统高;风湿类疾病包括关节肌肉疼等,直接影响到个体的活动能力,对劳动的影响程度较大,劳动参与率的处理效应下降10.5%;心血管类疾病包括心脏病、胸痛等,对个体劳动能力影响最大,劳动参与率的处理效应下降18.6%。 (3)医疗保险对健康风险平滑机制的城乡差异解释。
由表12的数据可以计算出城镇样本的参保率为94.52%,而农村样本的参保率为97.19%。尽管农村的参保率略高于城镇,但由于城镇职工医疗保险和城镇居民医疗保险的补偿力度明显大于新型农村合作医疗保险,城镇个体对健康风险的平滑作用要大于农村,从而可以解释农村面对健康风险冲击其劳动参与率下降的程度要比城镇高。不管是城镇还是农村样本中,参加医疗保险的个体收入明显高于没有参加医疗保险的个体,经济收入越高的个体,参保率越高,对健康风险的平滑作用越大,健康风险对劳动参与的影响程度也就得到一定程度的缓解。
表13反映了不同参保情况、城乡个体的患病差异,已参保的对象中城镇个体比农村的四周内患病率高,但未参保对象中城镇个体的四周内患病率比农村低。结果一方面说明了参加医疗保险后,城镇个体健康风险意识增强,对医疗服务的利用率比农村高;另一方面,未参保对象中,农村个体的家庭收入较低,自身健康状况较差导致了四周内患病率高,而城镇中的未参保对象大多数是家庭收入较高,自身健康状况较好的个体,故四周内患病率低,这是基准性差异带来的影响。
的个体参加医疗保险的概率相对于农村更高,这些人有了医疗保险后,可以更为方便地利用医疗服务更好地平滑健康风险,减少其对劳动参与的影响;农村中的低收入、四周内患病率高的个体参加医疗保险的概率相对较低,使其无法获取更多的医疗服务,而农村中参加医疗保险的对象为收入较高且四周内患病率低的个体,这也是造成农村个体患病后劳动参与率下降的处理效应要比城镇个体影响更为显著的重要原因。
(4)医疗保障对健康风险平滑机制的性别差异解释。由表14的数据可以计算出男性样本的参保率为95.73%,女性样本参保率为96.52%,女性的参保率略高于男性。参保概率的差别会带来医疗服务利用的差异性,影响健康风险的平衡作用,从而影响劳动参与率的高低。在参保群体中,女性个体的收入低于男性,说明低收入的女性更多地参加了医疗保险,
但高收入的女性个体没有參加医疗保险的比例明显高于男性。
表15反映了不同参保情况、性别的四周内患病情况差异,在参保样本中,女性的四周内患病率明显高于男性;而在未参保样本中,女性的四周内患病率略高于男性,其差距并不明显。收入高的男性更可能参与了医疗保险,而这些参与医保的男性四周内患病率低于女性;收入高的女性倾向于不参与医疗保险,这些不参加医保的女性四周内患病率却高于男性。
女性、参与医疗保险的个体经济情况较差,对医疗卫生服务的利用程度低。四周内患病率高的女性参保率相对较低,患病后得不到补偿,无法平滑其健康风险,这也就是造成患病后女性的劳动参与率的下降程度比男性高的原因。五、结论与启示
本文利用倾向得分匹配的反事实分析框架,利用最近邻匹配、核匹配和半径匹配三种匹配方法解决了样本的选择性偏误问题,通过研究健康风险冲击对劳动参与率的影响,得出如下研究结论:①健康风险冲击会显著降低劳动者的就业意愿,但远低于观测值之差。②健康风险冲击对劳动参与率的影响存在城乡的差异,对农村个体的劳动参与率的降低程度大于城镇。③健康风险冲击对劳动参与率的影响存在性别差异,患病的女性个体的劳动参与率下降程度比男性要大。④与匹配分析得到的处理组的净平均处理效应相比,使用OLS和Probit估计方法会显著高估四周内患病率对劳动参与率的下降作用。⑤患病的严重程度对劳动参与率的影响有差异性,轻微患病、不知道患病程度的个体对劳动参与率下降的影响较小,患病严重者会带来劳动参与率的较大幅度的下降。⑥患病的类别对劳动参与率的影响有差异性,患呼吸系统疾病影响最小,消化系统疾病和风湿类疾病次之,心血管类疾病的影响最大。基于此,本文还对健康风险冲击影响劳动参与率的机制进行探究,主要是个体的健康资本存量、医疗卫生服务利用、医疗保险类别及补偿、家庭收入水平等方面存在的差异性,导致不同患病个体劳动参与率降低程度的差异。基于研究结论,本文有以下启示。
首先,我国劳动者在遭受健康风险冲击后坚持继续工作的比例仍比较高,意味着大部分劳动者是在牺牲自身健康资本存量下带病坚持劳动,该研究结论和谭娜、周先波发现的“无休止劳动”是一致的[21]。现阶段城乡劳动者带病坚持工作的比例仍居高不下,折射出劳动者健康保障制度的实际问题。在“健康中国”的战略需求下,医疗保障的设计理念已经不能应对老龄化、疾病普遍化的挑战,需要向更高水平、更综合的健康保障发展理念转变。健康保障不仅仅是保障有病可医,更应负责劳动者在休假治疗期间的收入保障,在特定的情况下给予物质或资金的帮助,用以保障公民的健康权益,否则会出现劳动者因工作负荷、就医时间的机会成本过高,从而健康状况进一步恶化,并形成恶性循环,最终影响劳动者的就业参与和劳动生产效率的情况。
其次,健康需求和实际获得存在不匹配和非均衡。本文的研究结论显示男性和女性个体患病后对劳动参与的影响具有明显的差异,说明女性的健康需求比男性要强,但实际的健康服务却没有明显的差异,导致对劳动参与的影响要比男性要强。在农村,经济收入低、四周内患病率高的个体健康需求高,但实际的健康服务却较难获得,导致农村个体患病后对劳动参与的下降程度要比城镇明显。由此可见,医疗服务需求与实际获得之间存在不匹配和非均衡。党的十九大报告指出,新时代的社会主要矛盾已经转化为人民日益增长的美好生活需要和不平衡、不充分的发展之间的矛盾,而健康作为促进人的全面发展的必然需求,是最普遍意义的民生需求,也是美好生活最重要、最基本的需求。“健康中国”的发展理念追求的是全人群和全生命周期的健康服务,追求的不仅仅是“治病”,更是“治未病”,健康领域的发展理念要从“以治疗为中心”向“以预防为中心”转变、向促进全人群和全生命周期的“全面健康”发展目标迈进。
再次,医疗保险制度设计存在选择性和非均衡性。我国的基本医疗保障体系包括城镇职工医疗保险、城镇居民医疗保险、新型农村合作医疗保险和城乡医疗救助,城镇居民和新型农村合作医疗保险覆盖的人群最广,保障机制的设计存在一定的自选择性,参保是自由选择,居民是在考虑其自身健康需求和保费支付能力的前提下作出的参保决定,在面对健康服务费用支付方面采用分摊制,一定程度上会抑制低收入群体的参保意愿和医疗服务的利用率。低收入者容易陷入“健康条件差——劳动参与率低——获取经济收入低——参保能力低——医疗服务利用率——健康需求得不到满足”的恶性循环。健康权是公民享有的基本权利,全民基本医疗保险制度是对公民健康权益保障的制度化体现,由于设计上的差异导致低收入群体的医疗保险利用效率低下,显著降低了制度的公平性,也降低了制度的效率,对“健康中国”建设带来了负面影响。“健康中国”建设提出建立覆盖全民的医保制度,不仅仅是医疗保险的投保覆盖率达标,更重要的是“每个人当他需要时就能以支付得起的价格获得各种适宜的卫生保健”,要注重医疗保险利用效率的公平性,重点关注老年人、妇女儿童、贫困人口等弱势群体,降低起付线,增加门诊报销比例,真正构建起一个普惠型的全面医疗保障体系。 参考文献:
[1]SCHULTZ T W. Human resources human capital: policy issues and research opportunities [M]. New York: National Bureau of Economic Research,1972:176-193.
[2]LUFT S H. The impact of poor health on earnings[J]. The Review of Economics and Statitics, 1975,57(1):42-57.
[3]BENHAM L A. Employment earnings and psychiatric diagnosis[M].
FUCHS VR. Economic Aspects of Health. Chicago: The University of Chichago Press, 1982:203-220.
[4]都陽. 中国贫困地区农户劳动供给研究[M]. 北京:华文出版社,2001:105-124.
[5]樊明.健康经济学:健康对劳动力市场表现的影响[M].北京:社会科学文献出版社,2002:116-135.
[6]刘生龙. 健康对农村居民劳动力参与的影响[J]. 中国农村经济,2008(8):25-33.
[7]于大川,赵小仕. 健康对农民劳动参与的影响:基于CHNS数据的实证研究[J]. 农业现代化研究,2015,36(6):1038-1043.
[8]田艳芳. 中国中老年人的健康状况对劳动参与的影响[J]. 山西财经大学学报,2010(3):1-7.
[9]ETTNER S L, FRANK R G, RONALD C K. The impact of psychiatric disorders on labor market outcomes[J]. Industrial and Labor Relations Reviews, 1997, 51(1): 64-81.
[10]SCHULTZ T P, TANSEL A. Measurement of return to adult health: morbidity effects on wage rates in Cote d’lvoire and Ghana[R].
Living Standards Measurement Study Working Paper, 1992.
[11]曹乾,杜雯雯.健康的就业效应与收入效应:基于Heckman模型的检验[J].经济问题探索,2010(1):134-138.
[12]任兆璋,范闽. 健康对劳动参与的多值政策效应分析[J].广东社会科学,2006(1):38-43.
[13]魏众. 健康对非农就业及其工资决定的影响[J]. 经济研究,2004(2):64-74.
[14]ROSENBAUM P R, RUBIN D B. The central role of the propensity score in observational studies for causal effects[J]. Biometrica, 1983,70(2):41-55.
[15]刘生龙. 健康对农村居民劳动力参与的影响[J]. 中国农村经济,2008(8):25-33.
[16]于大川.更好的营养会促进农民的劳动参与吗?[J].西部论坛,2016(1):10-18.
[17]ROSENBAUM P R. Observational studies[M]. New York: Springer, 2002: 65-78.
[18]STURMER T, JOSHI M, GLYNN R J. A review of the application of propensity score methods yielded increasing use, advantages in specific settings, but not substantially different estimates compared with conventional multivariable methods[J]. Journal of Clinical Epidemiology, 2006, 5: 9-12.
[19]王建国. 中国居民健康对劳动参与的影响——基于多维健康指标的实证分析[J].北京科技大学学报(社会科学版),2011(1):104-110.
[20]杨志海,麦尔旦· 吐尔孙,王雅鹏. 健康冲击对农村中老年人农业劳动供给的影响——基于CHARLS数据的实证分析[J].中国农村观察,2015(3):24-37.
[21]谭娜,周先波.中国农村老年人“无休止劳动”存在吗?——基于年龄和健康对劳动供给时间影响的研究[J].经济评论,2013(2):19-29.
[责任编辑 刘爱华,方 志]