论文部分内容阅读
本人参与了教育部重大项目“高校本科专业设置预测系统”,针对人才供给预测子模块,对高校就业率预测进行了研究.大学扩招以来,高校毕业生逐年增多,社会就业市场对人才提出了更高的要求,高校就业率出现了下降趋势.影响高校就业率的因素很多,内在因素包括基础设施、师资力量、办学经费、培养规模、综合声誉等,外在因素包括经济增长幅度、社会人才需求量、社会经济氛围是否稳定、国家宏观调控政策等.研究就业率的影响因子,建立就业率的预测模型有着重要的实际意义.由于项目所涉数据属性维度过高,采集比较困难,故在时间有限的情况下,本文只在相对稳定的经济政治环境中考察高校的培养能力对就业率的影响,从而建立就业率预测模型.并且由于数据采集不全和数据量有限,本文只能针对小样本进行研究,从而,本文所做实验仅用于模型演示,不一定具备真正预测功能,
支持向量机是数据挖掘领域的新工具,在分类和预测领域有着热门的研究.基于支持向量机的特征选择算法SMA是一个用于分类预测的有效删除冗余属性的算法,能有效实现数据降维,避免维灾问题.本文提出了一种基于装袋思想的改进算法SMA1,同时也提出了一种基于数值预测的变形算法SMA2。
支持向量回归机在数值预测中有着重要应用,适合用来对高校就业率进行预测.目前,回归预测仍是最常用和有效的预测方法之一,并且组合预测理论指出,单项预测模型难以描述数据的整体规律性,故本文采用线性回归预测和Logistic回归预测作为辅助预测模型,然后对三种模型进行组合,修正误差.支持向量分类机的高斯核函数给我们一些属性边界值的预测启示,本文在结尾处做出了一些讨论,并在高校就业数据中给出了一些应用.