神经网络集成技术及其在癌症基因分类中的应用研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:xbalr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微阵列技术可以在不同条件下同时检测成千上万的基因在细胞中的表达水平。已成为生物信息学研究的焦点,对生物医学研究产生了极大的影响。在癌症的研究中,微阵列技术可以从肿瘤基因表达数据的变异研究中,获得更好的癌症诊断与治疗方法。人工神经网络已在很多领域得到了成功的应用,通过集成多个体网络提高系统泛化能力的神经网络集成技术已成为神经计算技术的一个研究热点。本文研究神经网络集成技术在癌症分类中的应用问题。针对基因表达数据中样本数量小的情况,本文介绍了神经网络集成算法Bagging与Boosting方法,并对它们进行分析比较。Boosting算法以提高不易分类样本的训练机会,也即增加这类样本被抽中的概率来提高系统的分类效果,但不稳定;而Bagging算法以等概率的方式抽样生成训练集,虽分类效果不如Boosting,但更为稳定。为此本文建立一种不等概的抽样方法产生训练集,训练个体网络。并在基因表达数据上进行实验。结果表明,这种方法能有效地提高分类效果。研究表明,有选择性地将部分个体网络用于集成能比全部个体网络用于集成获得更好的效果,针对选择个体网络用于集成问题,本文提出一种动态集成方法,即以分类准确率为标准动态选择个体神经网络集成。在基因表达数据上进行的实验结果表明,神经网络集成的效果得到显著提高。在基因表达数据的分析中,针对特征基因选择,本文给出一种改进的信噪比方法,以中位数取代均值作为信噪比的参量。并在基因表达数据上进行实验,表明该方法能有效地剔除冗余基因。针对特征基因的选取,本文还提出一种基于分层抽样的方法选择基因构成特征基因集,并在结肠癌数据集上进行实验。实验结果表明这种方法可更有效合理地获得特征基因集。将多个单个分类器共同构成分量分类器,以分类正确率较高的分量分类器进行集成得到最终分类效果。在基因表达数据上进行实验,结果表明,以这种方法集成可有效地提高分类预测结果。
其他文献
通过大量对比试验,对C50高性能混凝土配合比不断进行优化,最终确定最佳试验室配合比。
钢琴伴奏是一门独立的学科,在声乐演唱的实践中扮演艺术指导的作用。近些年,随着我国钢琴艺术和声乐艺术的双重发展,钢琴伴奏的艺术指导作用也越来越突显出来。相关于钢琴伴
<正> 1.冲动式无齿减速器冲动式无齿减速器没有传统减速器中的齿轮或蜗轮,体积小,可进行大速比的无级传动。其高速轴向低速轴传动的机理是依靠挚块与传动飞轮之间的摩擦。结
日本专卖公社(译者注:这是一专营香烟注册,销售的组织,只有经它批准的香烟才能在日本流通和销售)最近发售了一种名为“HALF TIME”的淡薄荷醇香烟。这种烟比同类烟轻四分之
期刊
目的探讨丹红注射液对慢性阻塞性肺病急性加重期(AECOPD)患者血清脑钠肽(BNP)的影响。方法选取本院2013年4月~2015年4月收治的84例AECOPD患者作为研究对象,随机分为对照组和
宁波海曙老城拥有着城市核心区重要组成部分和历史文化重要展示区双重属性,如何平衡城市核心区高可达性路网格局和历史城区街区式路网形态的矛盾,成为海曙老城发展的关键。本
本文在分析我国的水资源现状的基础上,总结了水资源利用存在的问题,并提出了促进水资源可持续利用的对策建议。
自噬(autophagy)是细胞通过溶酶自噬体来降解和消化自身受损、衰老以及丧失功能的蛋白、细胞器和部分细胞质等生物大分子的过程。自噬过程是真核细胞特有的行为,为细胞的再生
目的:考察大学生手机成瘾倾向和心理幸福感的基本状况及两者之间的关系。方法:利用大学生手机成瘾倾向量表和心理幸福感量表,采用随机抽样法获得有效问卷262份。结果:大学生手机
“以往传统的社会扶贫都是捐钱捐物,只是‘输血’而不会‘造血’,没有从根本上解决贫困地区的全面稳定脱贫问题。”商城县一位负责人说,“这些年通过发展景区产业扶贫,引导景