论文部分内容阅读
微观计量经济学是介于经济学和统计学之间的边缘科学,它是研究微观数据——即大量个人、家庭或企业的经济信息的经济理论和统计方法。近些年内,国内微观经济学的研究集中在模型、估计和检验理论与相关应用上,而对这些模型的基础——数据重视不够。经济理论、数学方法和数据是计量经济学模型成功的三大要素,样本信息的质量直接关系到计量模型经济模型成功与否。其中,缺失数据是影响样本质量的一个关键因素,在个人、团体或政府的社会调查中,常常面临着缺失数据的问题,然而,虽然微观计量经济学已出现了大量的相关理论与方法,但对于缺失数据对模型估计带来的问题,还没有引起研究者的足够重视。
基于上述原因,本论文从缺失数据(无回答)的入手,探讨了缺失数据产生的原因与机制,论述了缺失数据给微观计量带来的影响。就调查项目而言,回答层与无回答层是否在数量特征上存在差异,对抽样的影响是不一样的,这涉及到了样本代表性的问题。如果数据的缺失完全是随机的,丢弃不完整的回答虽然会减少估计的精度但是不会产生偏离。相反,如果无回答是故意造成的,或无回答集中于某类特殊群体,那么无回答层与回答层之间就存在明显的非随机性差异,它们之间就不具有相同的数量分布特征,那么仅采用完整数据的样本显然是不能代表总体特征的,这时,数据缺失除了会增加估计量方差外,还会带来较严重的估计量偏差。
在本文中,采用了EM算法来补救缺失数据给微观计量模型回归带来的影响。此方法是根据观测数据的分布对缺失值进行填补,其估计的结果比较准确和有效。本文以农民收入与消费为例,利用EM算法,分别比较了在线性回归模型和二元选择模型的回归过程中,是否对缺失数据进行插补的回归结果。比较结果得出,采用了EM算法后,模型的回归效果要好于直接删除数据法以及传统的均值插补法,此算法在一定程度上消除数据中隐藏的偏向,弥补了回答层与无回答层之间的差异,从而得出更加准确的结论。