论文部分内容阅读
随着我国经济长期高速发展,劳动经济也取得了持续稳健增长,在当前市场经济体制不完善的形势之下,劳动经济同样面临严峻挑战。区域间、行业间在劳动者工资、工作环境、福利保障等方面差异较大、发展不够均衡。因此有必要运用数据挖掘技术来分析当前的劳动力经济状况并预测未来的发展轨迹。本文数据选自《中国劳动统计年鉴2016》,是一份全面系统的反映我国劳动经济现状的年度统计出版物。汇编了2015年全国及各省、自治区、直辖市劳动统计数据,主要指标还编制了多年来的统计数据。通过研究《中国劳动统计年鉴2016》中的劳动统计数据,重点研究劳动统计指标以及对平均工资进行预测,应用四个模型。一、分析劳动统计指标(模型一、模型二)。对全国31个省级行政单位(不包括台湾、香港、澳门)的14项劳动统计指标分析。第一个模型应用主成分分析模型。利用主成分分析方法对劳动统计指标进行分析,计算出有关劳动统计指标的主成分得分,以总结全国各区域劳动经济现状。第二个模型应用聚类分析模型。使用经典的K均值聚类方法研究劳动统计指标,聚类省级行政单位,得到聚类结果,并联系实际情况分析我国不同地域的劳动经济现状。研究结果:模型一、二均能划分我国省级行政区域,且模型一得出的排名顺序与模型二分类结果一致。二、预测平均工资(模型三、模型四)。以1985-2010年的工资数据为研究对象,预测2011-2015年我国城镇就业人员平均工资,将结果与实际值进行比较,验证模型的拟合效果。第三个模型应用多元线性回归模型。以工资水平的影响因素作为变量建立多元线性回归模型,对平均工资进行预测。第四个模型应用时间序列分析模型。使用基于ARIMA模型的时间序列分析方法来预测平均工资。研究结果:模型三、四都能很好的预测平均工资。通过比较连续五年的预测值和实际值,误差分布在一个合理的范围内。