基于TCGA数据库不平衡数据的改进分类方法

来源 :安徽大学学报:自然科学版 | 被引量 : 0次 | 上传用户:louisvu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决癌症基因组图谱中DNA甲基化数据不平衡导致假阴率上升的问题,提出一种基于TCGA数据库不平衡数据的改进分类方法.使用合成少数类过采样技术和Tomek Link算法进行混合采样,解决数据不平衡问题.在此基础上,将经特征选择后的训练集数据输入改进模型进行训练、学习及分类.基于TCGA数据库6种癌症DNA甲基化数据的实验结果表明:改进方法对少数类样本的分类性能有显著提高,对多数类样本的分类性能也有一定的提升.
其他文献
目的探讨改良灌肠法的效果。方法将80例老年便秘患者按入院时间单、双日均分为观察组与对照组,观察组采用改良灌肠法,即甘露醇加肥皂水保留灌肠,对照组采用传统的肥皂水灌肠
目的了解某院临床使用糖肽类抗菌药物的情况,评价用药合理性,提高临床用药水平。方法采用回顾性调查方法,查阅2006年1月至2008年7月该院使用糖肽类抗生素的27例住院患者病历,
《四川教育》1994年1期发表了纪大海先生的《也说“戴帽初中”》(以下简称《也》文),文章观点鲜明,要求为“戴帽初中”正名,使之不再羞羞答答地发展下去。拜读后,对其主要观
麦熟一晌,"抢"字当先。6月13日下午,笔者在诸城市贾悦镇亲眼目睹了十几台大型联合收割机穿梭在孟家屯村田间抢收小麦,农民和各类农用车则忙着将麦子运出去晾晒,构成了一幅美丽
传统证据理论在进行多焦元属性融合时可能产生组合爆炸,当待合成证据体冲突时容易导致一票否决。针对以上两个问题,通过将待合成证据体转换为知识信息系统,应用粗糙集理论对
最近,由奥氏体和铁素体组成的双相不锈钢钢管混凝土作为一种新的组合形式出现了。这种钢管混凝土由外部是双相不锈钢管和内部是碳素钢管及内填混凝土组成。这篇文章介绍的是,
●无核早红 欧美杂交种,1986年河北省农科院昌黎果树所杂交育成,1998年通过品种审定并正式命名。 主要性状:果穗圆锥形,平均穗重300克;果粒近圆形、紫红色,平均粒重4.5克,
在市场经济的大潮中,到处都充满着诱惑,权力的掌握者所受的诱惑往往更大。因此,权力的掌握者在现实中必须耐得住寂寞,经得起诱惑,守得住清贫,尤其是在权力、生活、交往中把握住自己
以广州地区某办公楼为基础,利用DeST软件对在不同外围护结构下的全年空调冷负荷进行模拟分析。结果表明:在综合节能措施中,不同外窗玻璃所带来的总负荷减少率之差小于单项节能措
提出一种三相电压源型逆变器级联的静止同步补偿器。该补偿器主电路由具有独立直流侧电容的三相电压源型逆变器通过单相耦合变压器级联而成,耦合变压器的容量为补偿器容量的1/3