论文部分内容阅读
随着社保信息化建设,社保相关的管理平台积累的数据越来越多。从丰富的社保数据中挖掘出有用的潜在规律和模式,预测社保风险,制定有利于社保发展的政策越来越受到政府部门的重视。近些年,数据挖掘技术有了飞速的发展。数据挖掘技术与社保数据的结合正好能够满足人力资源和社会保障局的迫切需要,为此,江门市人社厅设立了人社大数据项目,联合学校、企业的技术及研发力量来共同挖掘社保数据的价值。本文是基于该项目展开的研究工作。我们首先对灰色Verhulst算法、BP神经网络算法、粒子群优化算法以及随机森林分类算法进行了系统研究,比较了各个算法的适用范围及优缺点,在此基础上提出了一种粒子群优化灰色Verhulst-BP神经网络组合预测算法,并将该算法运用在养老保险基金的预测上。其次通过对决策树分类算法、BP神经网络分类算法以及随机森林分类算法建模实验,确定并建立了用于不平衡数据分类预测的算法模型,并将该模型应用于企业不稳定分析预测中。我们取得的主要研究成果有:1.提出了一种基于粒子群优化的灰色Verhulst-BP神经网络组合预测算法,并将该算法与灰色Verhulst算法进行比较,实验表明该算法是有效。2.将改进的算法应用在养老保险基金的预测上,该算法较BP神经网络算法、灰色Verhulst算法以及灰色Verhulst-BP神经网络算法具有更好的鲁棒性和更高的预测精度。3.比较了决策树分类算法、BP神经网络分类算法以及随机森林分类算法在非平衡数据中的分类效果,将得到的评价结果进行分析,证实了随机森林分类算法在非平衡数据分类预测中具有更好的效果。4.应用随机森林分类算法构建了企业不稳定分析预测模型,实验表明,随机森林分类算法在不稳定企业识别中具有较好的效果。5.开发了企业不稳定分析预测平台,并将得到的预测结果在平台上进行可视化展示。