【摘 要】
:
针对高维数据集中冗余特征或无关特征降低机器学习模型分类准确率的问题,提出了一种基于近似马尔科夫毯的特征选择(nmRMR)算法。该算法首先利用最大相关最小冗余的准则进行特
【机 构】
:
北京邮电大学可信分布式计算与服务教育部重点实验室
【基金项目】
:
国家科技基础性工作专项资助项目(2015FY111700-6)
论文部分内容阅读
针对高维数据集中冗余特征或无关特征降低机器学习模型分类准确率的问题,提出了一种基于近似马尔科夫毯的特征选择(nmRMR)算法。该算法首先利用最大相关最小冗余的准则进行特征相关性排序;采用近似马尔科夫毯算法对冗余特征或者无关特征进行删除,并最大程度地提高特征之间的相关性从而获得最优特征子集。在UCI的8个公开数据集上对比的实验结果表明:与mRMR算法相比,本文算法所选择出的特征子集数平均减少了6.875个,平均分类准确率提高了0.78%;与FullSet算法相比,本文算法所选择出的特征子集数平均减少了20.
其他文献
为探究山奈属植物的光合特性。在温室栽培条件下。以山奈、海南三七、紫花山奈和小花山奈为试验材料.对其叶片的净光合速率、蒸腾速率、气孔导度和瞬时水分利用效率的日变化及
目的:探究纳洛酮对急性脑外伤出血患者的临床治疗效果。方法:选取笔者所在医院2011年4月-2015年2月收治的82例急性脑出血患者,按照入院的先后顺序将其分为观察组和对照组,每组4
在全民健身背景下,对甘肃省冰雪运动多元化发展路径深入分析,以期为甘肃省冰雪运动发展提供切实有效的理论依据。运用文献资料法、调查法,对甘肃省17家滑雪场进行实证研究。
血管淋巴管瘤(hemolymphangioma)是一种罕见类型的淋巴管瘤,表现为血管和淋巴管相混合,又称脉管瘤,常发生于婴幼儿,且多位于体表等部位[1]。成年人血管淋巴管瘤发生率极低,文献
宇宙的基本结构及其相互作用的奥秘都深藏于数学规律之中,这是毕达哥拉斯主义的基本理念。它分别体现在现代物理学的三大研究纲领中:(1)根据物理学的几何化纲领,引力场弯曲空间的
现如今,伴随着人们生活水平的不断提升,人们开始对精神文化生活提出了更高的要求,而电视摄像又是整个电视艺术中非常重要的一个部分,可以为广大群众展示出这个世界的丰富多彩
头屯河水库除险加固工程主要是对大坝、溢洪道、放水涵洞、泄水隧洞进行加固处理。为了保证放水涵洞洞内加固、高塔架、进口渐变段、坝前底部拆除新建等工程施工期间能够干地
介绍了内蒙古电网调度自动化的发展现状,并对该系统的重要性及调度自动化发展的重点进行了分析。
介绍了采用太阳能集热器干燥玉米的机理与实验装置的设计.在不同季节,采用太阳能集热器对玉米干燥过程进行了试验,测出了采用太阳能集热器干燥玉米的特性曲线,并对干燥曲线进
随着经济社会的发展以及人们生活水平的提高,近年来,人们对居住环境的要求逐渐提高。目前,随着汽车数量的显著增加,汽车尾气对城市的环境带来很大的影响,引起人们得密切关注