一种小样本数据的特征选择方法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:waixiao032124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
小样本数据由于其特征维数相对于样本数目较多,且常包含不相关或冗余特征,使得常用的机器学习算法处理小样本数据时无法得到好的效果,通过特征选择来降低数据维数是解决该问题的一种有效途径.针对小样本数据,提出一种基于互信息的过滤型特征选择方法,首先定义了基于互信息的特征分组标准,该标准同时考虑特征与类别的相关性和不同特征之间的冗余性,根据该标准对特征分组后,在各组内选出与类别相关性最大的特征构成候选特征子集,保证了算法具有较低的时间复杂度,之后采用Boruta算法,在候选特征子集中自动确定最佳特征子集,从而大幅度降低数据的维数.通过与5种经典的特征选择算法比较,在标准数据集上采用3种分类器的实验结果表明提出的方法选出的特征子集具有较好的运行效率和分类性能.
其他文献
目的基于PG-SGA评定量表的营养干预在胃部肿瘤患者中的评价及应用效果。方法选取江苏省苏北人民医院2016年10月至2018年10月收治的胃部恶性肿瘤患者125例,采用PG-SGA对患者进
回顾分析15例成人先天性髋关节发育不良继发骨性关节炎患者的临床资料。结果跛行基本消失,所有患者髋关节疼痛完全消除,功能明显改善,关节活动度增加,可从事正常生活和工作。
对我院2005~2010年收治的25例川崎病患者临床资料进行回顾性分析。结果该病多发于幼儿,25例患者中急性期冠状动脉一过性扩张9例(占36%),冠状动脉壁不规则3例(占12%),无异常13例,
“同志们!”寝室长一脸严肃地说,“形势不容乐观!”7月的重庆,白天室外温度起码得35℃往上数,就算是夜风阵阵的晚上,也让人不敢逃离冷气的温柔包裹.这个时候要是出门爬几百级
巫溪县中梁乡石锣村曾是一个贫困村,却在2015年提前完成了脱贫攻坚任务,还先后获得市、县、乡等各类表彰150余项. 石锣村的今天与“艰苦奋斗、自强不息”的石锣精神分不开,同
期刊
1975年3月,我还不满11岁,在甘肃河西走廊的一所农村小学上五年级。春寒料峭。十几个孩子挤在一间狭窄的教室里,前面是一块刷了墨汁的木板。开学好多天了,除了算术课复习之外,
收治的实行椎管内麻醉后引发暂时性神经病学综合征的患者共40例,将这些患者随机分为A组和B组,A组为治疗组,B组为非治疗组,通过临床观察,发现其中有24例在蛛网膜下腔麻醉后发