基于支持向量机的特征选择算法研究

被引量 : 0次 | 上传用户:Java8657
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代谢组学可以被定义为一种重点考察生物体系受到外界因素的加入(如感染、疾病、药物等)其代谢产物的变化以及其随时间的变化趋势和代谢途径的科学方法。代谢组学方法产生的数据一般是高维小样本的数据,其中包含很多的噪音和冗余数据。因此,从中提取出具有解释能力的数据对理解复杂生物的代谢过程是非常重要和有意义的。在代谢组学数据的处理中,多元统计分析和机器学习算法的利用是十分必要的,例如主成分分析(PCA)、偏最小二乘判别分析(PLS-DA)等。支持向量机(SVM)是一种具有良好的推广能力的方法,相比较于其他的多元统计方法具有明显的优势。SVM-RFE是一种基于支持向量机的特征选择算法,该算法也是一种非常有效的方法。在近些年来,特征选择算法的稳定性也受到了越来越多人的关注。本文首先利用不同策略的SVM和SVM-RFE对水稻纹枯病进行处理,并与PLS-DA进行对比。结果表明,前者具有较好的分类能力并且提取出了较少的特征,模型的R2/Q2值及其截距表明特征选择后的结果所建的模型具有很好的解释能力和预测能力。SVM-RFE的特征筛选过程是一个反向的删除过程,其中每次排在最后的m(过滤因子)个特征被删除,然而其中m的大小对算法造成了不稳定。因此,本文提出了一种基于动态过滤因子的SVM-RFE算法,即SVM-RFE-DFF,该算法在每次迭代的窗口中删除了噪音和冗余属性。之后,算法中加入了融合技术,从而进一步的提高了算法的性能以及稳定性。该算法应用于代谢综合症的处理之中,实验的结果表明SVM-RFE-DFF的分类效果比SVM-RFE要好,而且窗口对SVM-RFE-DFF的影响要远小于过滤因子对SVM-RFE的影响,同时融合技术加入后使得算法有了更进一步的提高。
其他文献
变压器是电力系统的关键设备之一,其能否正常运行直接关系到输变电系统的稳定。对变压器绝缘的在线状态监测,可以随时了解变压器内部绝缘性能,给变压器检修工作和检修计划提
公司清算义务人制度是公司清算制度的重要组成部分,它关系到公司在解散后能否正常启动清算程序以及在公司非法退出市场的情况下的责任承担问题,同时也关系到市场主体交易安全
本文以办公自动化系统相关的设计理念和技术为基础,研究了具有复杂业务关系办公系统的特点,研究设计了吉林省自考办考试项目管理平台的系统模型,实现了具有通用性可扩展性的
教研组是学校学科教育教学的一个专业性基层组织,是学科教师提高专业知识水平重要平台。教研组工作的好坏直接关系到学校教学工作的好坏及教师的专业素养的优劣。随着新课程
振动压路机因其高效的振动效率和适用性被广泛应用于各压实环境中。目前振动压路机的产量和销售量都占据着主导地位。振动压路机的工作性能的好坏也开始越来越受到人们的重视
随着经济的发展,电力系统的可靠性和电能质量越来越多地受到人们的关注,而大量具有非线性、冲击性的电气设备广泛应用于电力系统及日常生活中,导致电能污染日趋严重,因此,对
军用车辆使用环境比较复杂,为了满足武器系统快速机动发射的需求,要求导航系统具有高精度、高可靠性、自主性和抗干扰性。任何单一的导航系统都难以满足这一要求,多传感器信
近年来,随着超声成像技术的发展,超声成像逐渐成为医学影像学中重要的诊断手段之一,但由于成像设备和成像原理等各方面的原因,将导致其成像结果会出现斑点噪声的干扰。医学超
我国竞技体育奖励随着社会政治的变革不断发生变化,新中国成立后竞技体育奖励制度逐步形成发展,但时代的进步要求竞技体育奖励制度必须顺应潮流,不断完善。本文旨在通过文献
共同海损是海商法中一项特殊的、独立的民事法律制度,在海上运输的风险分摊、船货双方的利益平衡上,有着重要的地位。本文从共同海损概念的界定入手,系统阐释了共同海损法律