基因表达数据特征子集的冗余研究

来源 :统计与信息论坛 | 被引量 : 0次 | 上传用户:tata890
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
过滤式特征选择是一种在基因表达数据上广泛使用且简单有效的方法。针对其特征子集冗余性问题,使用皮尔逊相关系数,提出一种带冗余去除的特征选择算法。研究了在不同相关强度下特征子集冗余去除及分类准确度效果。实验选用三个不同的基因表达数据集,使用支持向量机、k近邻、随机森林作为分类器分别进行了测试。实验结果表明,带冗余去除的过滤式特征选择方法在不同分类器上均能获得良好的分类性能,另外,此方法在降低特征子集维度的同时能够提高分类准确度。
其他文献
通过对1219名高职生的调查研究表明:高职生的创新精神和社会自我效能感较好,但学习动机普遍不足;高职生的学习动机、社会自我效能感与创新精神呈显著正相关;社会自我效能感对
农业、农村与农民问题是贯穿我国现代化进程和中华民族复兴之路的基本问题。党的十九大报告高瞻远瞩地提出了实施乡村振兴战略。湖州作为"两山"理念诞生地,地处沿海发达地区,
目的:了解杭州市萧山区冷菜食品卫生现状,为今后该类食品卫生监督监测提供依据,方法:对2003—2005年杭州市萧山区餐饮行业中的冷菜食品进行抽样卫生监测,并对抽检的4类537份冷菜样