论文部分内容阅读
随着人类社会健康水平的不断提高,健康的影响因素成为一个广受关注的话题。进入新世纪,快节奏社会生活带来的各种工作和生活压力,导致我国亚健康人群数量与日俱增。同时,随着生活水平的提高,人们对就医、慢病预防和管理、体检、养老看护及日常健康保健等需求越来越迫切,且需求呈现出规模化、多样化和个性化的特点。为了达成健康这个目标,就必须知道健康状况的影响因素。随着我国早已经进入老龄化社会,人口增速变缓,死亡率下降,同时平均寿命延长。我国本身还没有实现现代化,经济还不发达,目前已经“未富先老”,社会还没能提供足够的资源来缓解老龄化带来的一系列问题。随着年龄增大,老年人的身体机能显著下降,丧失生活能力,伴随着出现心理焦虑、抑郁等问题。传统的家庭养老功能减弱,家庭本身的养老功能在逐渐减弱,养老的负担越来越多的将依赖社会,但是养老服务的发展跟老年人的需求不匹配。针对以上情况的出现,为了维护老年人的功能在最佳状态,实现健康老龄化。对老年人健康影响的研究具有非常重要的实际意义。
健康的影响因素研究,在理论领域和应用领域都受到了国内外学者的广泛关注,成为现代社会学、医学和微观经济学领域的重要课题。国内外学者对健康状况影响因素的研究,较多集中于医疗保险、养老保障等方面的研究,而较少从公共设施和活动场所的提供方面来研究其对健康状况的影响。其次,微观领域在研究健康状况的影响时,大多数从个体入手。如今,社区成为居民活动的重要场所,生活在同一个社区的居民在健康方面往往具有共性,这就需要对社区群体进行研究。
国内外文献指出,健康的影响因素因为各自采用的指标不同,各自的影响因素也不同。在学术研究中,健康的影响因素主要分为:自评健康的影响因素、老年人生活自理能力的影响因素和慢性病的影响因素。因为本文采用的是社区数据,并非对个体的健康状况进行研究,所以死亡率是本文最合适的健康指标。同时选取其他的18个指标作为被解释因素的指标。因此,本文基于2011年中国健康与养老追踪调查社区问卷数据,将数据中所有能提取的变量列入可能的影响因素,结合处理缺失值和异常值的方法理论,研究了中国社区健康状况的影响因素,然后就城镇和农村分别研究,找到各自的影响因素及影响差异,最后分析了差异产生的主要原因。一方面,有利于充实微观计量经济学和健康学的研究内容和方法;另一方面,综合当前我国的国情考虑,实证研究结果有助于了解与健康相关的因素及其影响程度,同时利于政府制定相关的政策和措施,社区和养老机构也能参考这些实证结果完善服务,具有非常重要的实际应用价值。本文的主要结构安排如下:
第一,理论部分。首先,对缺失值的缺失模式和处理方法进行简要介绍,给出了ER算法,为后面研究数据的缺失模式和算法的应用垫下理论基础;其次,结合OLS回归估计介绍了分位数回归的原理,不仅在理论上将OLS回归和QR回归联系起来,还为在后面的实证分析打下理论基础。
第二,数据预处理。首先,本文将选取社区平均死亡率(Mortal)作为被解释变量,基础设施和活动场所、人口结构、医疗保险和社会保障政策、灾害发生与否和人均可支配收入等18个变量作为被解释变量,对所有变量进行描述性统计;其次,结合图形和变量的相关关系来研究本文数据的缺失模式;最后结合主成分分析分析,运用ER算法和MICE方法填充数据缺失,用缩尾方法来处理异常值,完成对数据的初步整理。
第三,实证分析。利用WMD检验,将本文模型设定为半对数线模型,分别基于OLS回归模型和QR模型研究社区健康的影响因素;其次,分城镇和农村社区分开建模,比较城镇和农村健康影响情况的差别,同时比较OLS回归和QR回归结果的区别。最后,对城镇和农村社区的不同,结合OLS估计结果,采用Blinder-Oaxaca分解检验来解释其差异。
以上几个步骤逐层递进、环环相扣。围绕数据预处理及QR在社区健康影响因素中的应用进行了系统的研究,得到了如下几点重要结论:
(一)就公共服务对中国社区健康的影响来看
在总体模型中,基础设施和活动场所的整体水平、污染程度都是影响社区健康状况的显著变量,污染程度对死亡率低的人群影响更大。根据模型还原后的结果,对社区健康状况影响较大的主要是自来水的使用率、健身活动场所和服务类组织的提供情况。从综合主成分(F1)的QR结果看,公共服务对中等以下健康水平的社区居民的影响更大,增加公共服务水平,中等以下健康水平的人群受益更大。Appleton(1998),卢洪友和祁毓(2013)也得到类似的结论,都证实了公共服务是对人口健康有益的。
公共服务对中国社区健康的影响存在很大的城乡差异,基础设施和活动场所两大部分在农村样本回归模型中的系数更大,体现得都较为明显。农村社区相比于城镇社区而言,基础设施和活动场所的构建就相当缺乏,随着农村居民的消费和教育水平提高,农村居民对学校、超市等必要基础公共设施当然有更大的需求量。农村居民的娱乐、休闲活动越来越丰富,必然对健身活动场所和娱乐设施的需求更多,故而在回归模型中的系数也较大。但是对于大部分社区的中老年居民来说,城镇居民更追求运动能力和相关娱乐活动,增加城镇社区的基础设施和活动场所的提供量,可以极大的促进这部分居民的健康水平,特别是健康状况好的城镇居民。相对于农村社区,生活原料在城镇社区对健康影响更大,通过改善社区的生活原料质量,城镇社区健康水平差的居民受益更多。城镇经济的高速发展促成了工厂的快速扩建,影响到周围社区人口的健康,故而污染主成分在城镇社区模型中的系数更大。
(二)就人口结构与社区健康的关系来看
城镇比农村的社区健康水平高,值得一提的是,不管是城镇还是农村社区,65岁以上的老年人口比重在回归模型中的系数都很大。在总体样本中,1单位65岁老年人口比重的增加将导致社区的平均死亡率上涨7.154‰,在城镇样本中此系数更大,说明老龄化可以严重影响到社区的整体健康水平。随着身体机能的退化,老年人慢性病逐渐增多,自理能力逐渐下降,健康状况自然大不如前,老年人自然会成为社会关注的对象,所以很多学者开始研究老年群体的健康影响因素(曾毅等,2010)。而且,健康水平越低的农村社区,健康水平受人口老龄化的影响越小,城镇社区则相反。除了老龄化这个最显著的因素,平均受教育年限对中国社区健康状况的影响在总体样本和城镇样本中体现得较为明显,说明城镇对教育的要求更高,这与毛毅和冯根福(2010)的研究发现一致。通过提高受教育水平来提高健康水平,健康状况较好的城镇社区居民受益最大。相较于农村居民,城镇居民更为重视教育水平。少数民族人口的比例对社区健康状况没有影响。
(三)就医疗保险、保障与社区健康状况的关系来看
医疗保障通过影响人们的医疗服务利用行为,从而促进人们健康水平的提高(Bunker,1995;Levy和Meltzer,2001)。医疗机构的个数对社区健康的影响在总体样本和城镇样本中表现的较为明显,医疗对农村社区中健康水平低的人群和城镇社区中健康水平高的人群会更为显著。农村社区居民本身就重视疾病,健康水平低的居民对于疾病的治疗需求更大,城镇居民本身更注重保健和预防,健康状况好的居民会更有预防意识。参保的增加率对社区健康的影响则在总体样本中表现的较为明显,保险(Insu)对社区居民的健康水平的影响在低分位数上显著,保险因素对社区健康状况好的居民影响更为显著。
(四)基于城镇和农村社区健康状况的Blinder-Oacaxa分解
农村社区的平均死亡率远远高于城镇社区,二者的总体差异相差38.20%。从系数差异来看,四部分中的系数差异数值为正数且对平均死亡率有显著影响,出现这种现象的原因在于:城镇人口有更优越的条件和生活环境,医疗和保健等方面获得的更多。从禀赋差异来看,在设定死亡率的影响因素对其他影响相同的情况下,农村的全部影响因素的条件相对较差。其中基础设施和活动场所因素和医疗、保险和社会保障政策这两个因素对平均死亡率的影响在城镇和农村社区之间存在初始禀赋差异。
与其他文章相比,本文的创新点主要基于以下两个方面:
(1)从研究问题来看,本文利用问卷提供的信息,不仅从总体上分析了基础设施和活动场所、人口结构、医疗保险、灾害发生与否和人均可支配收入等对健康状况的影响,还具体分析了这种影响存在的城乡差异,为了更清晰全面的了解被解释变量和解释变量的关系,本文不只采用了传统的OLS方法来估计模型,更采用了QR模型来进行估计,分析了在不同的健康水平上各因素的影响之间的差异和变化规律。这对于社区制定更为详细、具体的健康状况改善政策提供了重要的实证依据;
(2)从使用方法来看,首次考虑使用能够处理异常值和缺失数据的稳健部分主成分回归分析方法,本文用ER算法来处理基础设施和活动场所部分的9个变量,这样既可以解决这些变量的多重共线性,同时可以处理缺失值;其次,在城乡差异分析中,本文不仅分析了城乡社区健康的具体不同影响因素,还利用Blinder-Oacaxa方法量化并分解了这种差异,以挖掘差异产生的根本原因。
健康的影响因素研究,在理论领域和应用领域都受到了国内外学者的广泛关注,成为现代社会学、医学和微观经济学领域的重要课题。国内外学者对健康状况影响因素的研究,较多集中于医疗保险、养老保障等方面的研究,而较少从公共设施和活动场所的提供方面来研究其对健康状况的影响。其次,微观领域在研究健康状况的影响时,大多数从个体入手。如今,社区成为居民活动的重要场所,生活在同一个社区的居民在健康方面往往具有共性,这就需要对社区群体进行研究。
国内外文献指出,健康的影响因素因为各自采用的指标不同,各自的影响因素也不同。在学术研究中,健康的影响因素主要分为:自评健康的影响因素、老年人生活自理能力的影响因素和慢性病的影响因素。因为本文采用的是社区数据,并非对个体的健康状况进行研究,所以死亡率是本文最合适的健康指标。同时选取其他的18个指标作为被解释因素的指标。因此,本文基于2011年中国健康与养老追踪调查社区问卷数据,将数据中所有能提取的变量列入可能的影响因素,结合处理缺失值和异常值的方法理论,研究了中国社区健康状况的影响因素,然后就城镇和农村分别研究,找到各自的影响因素及影响差异,最后分析了差异产生的主要原因。一方面,有利于充实微观计量经济学和健康学的研究内容和方法;另一方面,综合当前我国的国情考虑,实证研究结果有助于了解与健康相关的因素及其影响程度,同时利于政府制定相关的政策和措施,社区和养老机构也能参考这些实证结果完善服务,具有非常重要的实际应用价值。本文的主要结构安排如下:
第一,理论部分。首先,对缺失值的缺失模式和处理方法进行简要介绍,给出了ER算法,为后面研究数据的缺失模式和算法的应用垫下理论基础;其次,结合OLS回归估计介绍了分位数回归的原理,不仅在理论上将OLS回归和QR回归联系起来,还为在后面的实证分析打下理论基础。
第二,数据预处理。首先,本文将选取社区平均死亡率(Mortal)作为被解释变量,基础设施和活动场所、人口结构、医疗保险和社会保障政策、灾害发生与否和人均可支配收入等18个变量作为被解释变量,对所有变量进行描述性统计;其次,结合图形和变量的相关关系来研究本文数据的缺失模式;最后结合主成分分析分析,运用ER算法和MICE方法填充数据缺失,用缩尾方法来处理异常值,完成对数据的初步整理。
第三,实证分析。利用WMD检验,将本文模型设定为半对数线模型,分别基于OLS回归模型和QR模型研究社区健康的影响因素;其次,分城镇和农村社区分开建模,比较城镇和农村健康影响情况的差别,同时比较OLS回归和QR回归结果的区别。最后,对城镇和农村社区的不同,结合OLS估计结果,采用Blinder-Oaxaca分解检验来解释其差异。
以上几个步骤逐层递进、环环相扣。围绕数据预处理及QR在社区健康影响因素中的应用进行了系统的研究,得到了如下几点重要结论:
(一)就公共服务对中国社区健康的影响来看
在总体模型中,基础设施和活动场所的整体水平、污染程度都是影响社区健康状况的显著变量,污染程度对死亡率低的人群影响更大。根据模型还原后的结果,对社区健康状况影响较大的主要是自来水的使用率、健身活动场所和服务类组织的提供情况。从综合主成分(F1)的QR结果看,公共服务对中等以下健康水平的社区居民的影响更大,增加公共服务水平,中等以下健康水平的人群受益更大。Appleton(1998),卢洪友和祁毓(2013)也得到类似的结论,都证实了公共服务是对人口健康有益的。
公共服务对中国社区健康的影响存在很大的城乡差异,基础设施和活动场所两大部分在农村样本回归模型中的系数更大,体现得都较为明显。农村社区相比于城镇社区而言,基础设施和活动场所的构建就相当缺乏,随着农村居民的消费和教育水平提高,农村居民对学校、超市等必要基础公共设施当然有更大的需求量。农村居民的娱乐、休闲活动越来越丰富,必然对健身活动场所和娱乐设施的需求更多,故而在回归模型中的系数也较大。但是对于大部分社区的中老年居民来说,城镇居民更追求运动能力和相关娱乐活动,增加城镇社区的基础设施和活动场所的提供量,可以极大的促进这部分居民的健康水平,特别是健康状况好的城镇居民。相对于农村社区,生活原料在城镇社区对健康影响更大,通过改善社区的生活原料质量,城镇社区健康水平差的居民受益更多。城镇经济的高速发展促成了工厂的快速扩建,影响到周围社区人口的健康,故而污染主成分在城镇社区模型中的系数更大。
(二)就人口结构与社区健康的关系来看
城镇比农村的社区健康水平高,值得一提的是,不管是城镇还是农村社区,65岁以上的老年人口比重在回归模型中的系数都很大。在总体样本中,1单位65岁老年人口比重的增加将导致社区的平均死亡率上涨7.154‰,在城镇样本中此系数更大,说明老龄化可以严重影响到社区的整体健康水平。随着身体机能的退化,老年人慢性病逐渐增多,自理能力逐渐下降,健康状况自然大不如前,老年人自然会成为社会关注的对象,所以很多学者开始研究老年群体的健康影响因素(曾毅等,2010)。而且,健康水平越低的农村社区,健康水平受人口老龄化的影响越小,城镇社区则相反。除了老龄化这个最显著的因素,平均受教育年限对中国社区健康状况的影响在总体样本和城镇样本中体现得较为明显,说明城镇对教育的要求更高,这与毛毅和冯根福(2010)的研究发现一致。通过提高受教育水平来提高健康水平,健康状况较好的城镇社区居民受益最大。相较于农村居民,城镇居民更为重视教育水平。少数民族人口的比例对社区健康状况没有影响。
(三)就医疗保险、保障与社区健康状况的关系来看
医疗保障通过影响人们的医疗服务利用行为,从而促进人们健康水平的提高(Bunker,1995;Levy和Meltzer,2001)。医疗机构的个数对社区健康的影响在总体样本和城镇样本中表现的较为明显,医疗对农村社区中健康水平低的人群和城镇社区中健康水平高的人群会更为显著。农村社区居民本身就重视疾病,健康水平低的居民对于疾病的治疗需求更大,城镇居民本身更注重保健和预防,健康状况好的居民会更有预防意识。参保的增加率对社区健康的影响则在总体样本中表现的较为明显,保险(Insu)对社区居民的健康水平的影响在低分位数上显著,保险因素对社区健康状况好的居民影响更为显著。
(四)基于城镇和农村社区健康状况的Blinder-Oacaxa分解
农村社区的平均死亡率远远高于城镇社区,二者的总体差异相差38.20%。从系数差异来看,四部分中的系数差异数值为正数且对平均死亡率有显著影响,出现这种现象的原因在于:城镇人口有更优越的条件和生活环境,医疗和保健等方面获得的更多。从禀赋差异来看,在设定死亡率的影响因素对其他影响相同的情况下,农村的全部影响因素的条件相对较差。其中基础设施和活动场所因素和医疗、保险和社会保障政策这两个因素对平均死亡率的影响在城镇和农村社区之间存在初始禀赋差异。
与其他文章相比,本文的创新点主要基于以下两个方面:
(1)从研究问题来看,本文利用问卷提供的信息,不仅从总体上分析了基础设施和活动场所、人口结构、医疗保险、灾害发生与否和人均可支配收入等对健康状况的影响,还具体分析了这种影响存在的城乡差异,为了更清晰全面的了解被解释变量和解释变量的关系,本文不只采用了传统的OLS方法来估计模型,更采用了QR模型来进行估计,分析了在不同的健康水平上各因素的影响之间的差异和变化规律。这对于社区制定更为详细、具体的健康状况改善政策提供了重要的实证依据;
(2)从使用方法来看,首次考虑使用能够处理异常值和缺失数据的稳健部分主成分回归分析方法,本文用ER算法来处理基础设施和活动场所部分的9个变量,这样既可以解决这些变量的多重共线性,同时可以处理缺失值;其次,在城乡差异分析中,本文不仅分析了城乡社区健康的具体不同影响因素,还利用Blinder-Oacaxa方法量化并分解了这种差异,以挖掘差异产生的根本原因。