模式分类中特征选择算法的研究

被引量 : 0次 | 上传用户:darling1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技的迅猛发展使得我们获得信息量爆炸式增长,如何从这些信息中的得到有价值的数据,模式分类等人工智能的科学应运而生并且逐渐成为研究热点之一。模式分类系统为了最大获得某些事物的特征等相关的信息,将通过以下四个步骤,分别是获取某事物的特征数据,对数据进行预处理,再接着通过特征选择,最后是对特征数据进行特征评估。经过这四个步骤后将能获取某具体事物的正确分类。然而数据的维度越来越高将会造成维数灾难,无关和冗余特征较多等特点的出现迫切使得研究人员需要在传统的算法上进行优化和创新,使得新的算法在通用性上更强并且在运行效率上更高,而对于模式分类系统中非常的重要的特征选择环节是我们得到优良分类器的重要前提。本文首先介绍了特征选择的理论基础和特征选择算法的分类,概述了国内外特征选择算法的研究现状,在ReliefF算法和主成分分析算法的基础上进行了优化和创新,即基于ReliefF优化的核主成成分析的二次特征选择法。本文首先验证了基于PCA的ReliefF方法比单纯的ReliefF方法提取出的有效的信息更多,然后验证了KPCA比PCA得到的特征的维数更低,并且提供的特征信息更多,最后在ReliefF和KPCA结合的方法上又加入了了二次特征筛选和去除冗余信息的方法。本文基于ReliefF优化的核主成成分析的二次特征选择算法能够有效处理维度过高,具有冗余特征和无关特征的数据,并且实验证明了该算法具有较强的分类准确度。
其他文献
根据LNG接收站及液化站对其配套空压制氮系统的特殊要求,提出空压制氮系统主要设备的选型及适用的工艺流程设计。
研究了基本培养基和植物生长调节剂对平薯3号脱毒苗生长的影响,结果表明:MS培养基是平薯3号脱毒苗生长的最佳培养基。激素NAA能有效促进生长,其最佳质量浓度为0.5-1.0 mg/l,而
超临界CO2染色技术是一种新型的无水染色技术,染料在超临界CO2中的溶解度是超临界CO2染色工艺的一个重要基础数据。在压力16~28MPa、温度343.2~383.2K范围内,采用静态循环法对
论文依托喀兰古公铁立交连续梁大桥施工工程,利用桥梁工程软件MIDAS/Civil建立主梁有限元模型,对主梁的施工过程进行了仿真分析,计算了不同施工阶段主梁的变形、内力和混凝土应力
广州创科生物科技有限公司是广州市一家专业美容企业,以生产高科技专业美容产品为主。随着经济的飞速发展和人们生活水平的不断提高,中国的化妆品市场迎来了前所未有的发展良
本文研究的目的是根据医院的实际业务流程开发基于Andriod平台的小型药品采购管理系统,作为药房药物采购管理系统的一个增补。本系统主要功能是实现药品采购信息规整的自动化
在当今知识经济时代,企业之间的竞争越来越表现为人才这一核心资源的争夺。企业能否吸引并留住员工,尤其是有能力的员工,成为影响企业竞争实力的关键因素之一。但是由于当前
鉴于其能够充分利用供应链中各个企业的优质资源,装配系统已经在汽车、电子等众多行业中得到了广泛的应用,但始终存在的挑战是如何保证系统中每一个节点企业都能够协调同步的运
通过氧化石墨烯(GO)和壳聚糖(Cs)之间的氢键以及静电作用形成GO水凝胶,从而将纳米硅颗粒和碳纳米管(CNT)原位包封于其中,再经冷冻干燥及随后的热处理制得三维硅/碳纳米管/石
根据交通数据显示,行人是交通事故中的主要受害者,为此各国相继颁布了行人保护条例以提高汽车的行人保护功能。当行人与车辆发生碰撞时,行人腿部是主要的受伤部位,而且由于保