基于演化超网络集成的癌症分子分型方法

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:drlanrq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症的正确分类是现代癌症治疗的重要组成部分,准确的癌症诊断可以为癌症患者采取适合的治疗方法提供帮助。传统的癌症诊断方法主要依据症状、体征、影像检查、组织细胞病理等临床和组织病理学信息进行诊断,存在诊断时间长,花费高等缺点。另外,相当多的恶性肿瘤形态特征并不明显,难以分辨,造成基于组织检查或者影像分析的癌症诊断方法精度不高,频繁错过患者的最佳治疗期。由此,许多研究者开始对分子水平上的“指纹”----DNA微阵列进行研究,从而从分子水平利用基因表达数据对癌症进行分类和预测,希望可以为癌症的诊断和治疗提供强而有力的帮助。DNA微阵列技术又称基因芯片,是多种技术的结合,发展十分迅速。采用DNA微阵列技术,能够同时观测生物样本中成千上万个基因的表达水平,可以从分子水平上发现不同癌症样本以及正常样本中基因表达的异同,从而为癌症更进一步的准确分类提供了可能。由于DNA微阵列自身的特点,在进行癌症分类之前必须要进行特征基因选择。同时,传统模式识别方法存在过度适应,学习和识别时间长,学习结果不易分析等局限,考虑到演化超网络能够表达复杂数据的内在结构,可以有效挖掘特征与特征、特征与类别之间的关联程度,适合解决基于DNA微阵列的癌症分型问题,所以本文采用演化超网络作为基分类器,并对多个基分类器进行集成,进而解决多种癌症数据集的分类问题。   本研究主要内容包括:⑴DNA微阵列是一种样本数量较少,维度很高,噪声和冗余基因多的数据,为了能够构建一个高效准确的癌症分型系统,本文探索了五种基于过滤的特征基因选择方法,分别通过与演化超网络分型系统结合,寻找与分类器比较适合的选择方法。⑵针对目前超网络对多类型癌症分型研究较少的问题,提出了基于演化超网络的多类型癌症分子分型方法。主要方法是采用一对多的方式,把多类问题转化为二类问题。先生成一系列的二类分类器,然后把多个二类分类器集成起来,成为最终的多类型分型系统。实验表明文中构建的系统具有与其他传统分类方法可比的识别率,同时有利于挖掘癌症分类相关基因,具有良好的学习结果可读性。⑶为提高系统的识别率,稳定性及泛化能力,本文引入了选择性集成方法。首先从原始训练集中随机选择样本来训练有差异的基分类器;然后采用遗传算法对基分类器进行选择和集成,形成最终的多分类器集成系统;最后,利用该系统对独立的测试集进行测试,验证该系统的性能。实验结果表明,同单一分类器相比,该方法建立了一个稳定、性能良好的癌症分子分型系统。
其他文献
地球表面三分之二以上的面积是为海洋所覆盖,海洋中有着丰富的尚未完全开发的资源。随着世界经济的发展,人类对于能源的需求日益增长,而陆地上的资源经过长期的开采,已经渐渐匮乏
智能交通技术是解决城市交通问题的主要途径。其中,基于数字地图的导航服务作为智能交通系统中的主要内容之一,已经得到广泛应用。同时,基于交通标志识别的视觉导航技术对实现车
随着信息技术的高速发展,云计算在人们的生活中扮演着越来越为重要的角色。云计算利用虚拟化技术将分布在不同地域的计算资源进行整合,实现基础设施资源的共享,用户可以通过终端
在数字媒体技术领域,3D游戏引擎是一种重要的游戏开发手段。引擎中的渲染技术已经成为国内外研究的热点,也是受关注程度最高的关键技术之一。近几年3D游戏引擎在Android平台上
地震灾害带来了大量的人员伤亡及财产损失,严重威胁人类安全和社会稳定,震后的应急救援显得非常重要。近年来,越来越多的志愿者参与到震后应急救助过程中,是对紧急状态下政府应急
实现用户/租户的信息资产安全与隐私保护是云计算安全的热点和难点问题。云存储是实现云计算服务的基本条件,而云存储服务大规模应用的关键是保证用户的数据安全,其中的难点之
随着通信技术的快速发展3G技术已经较为成熟,目前各国正积极发展4G技术,希望在4G技术市场上取得优势。我国在3GPP(3th GenerationPartnership Project)推出的LTE(Long Time Evo
无线Mesh网络(WMN)作为新型的无线宽带接入技术,已引起国内外越来越多的关注。在目前的研究工作中,如何结合无线Mesh网络的自身特点,设计高效的无线Mesh网络十分重要;而路由协议
对于加密数据检索的研究是云安全领域的一个重要研究方向。加密数据的检索主要分为基于关键字索引的可搜索加密技术和基于全文扫描的密文检索技术。在本文中将对基于关键字索
尽管当前语音识别技术已经取得了广泛的应用,但是在封闭环境中进行远距离语音识别时,由于受到混响效果的影响,从而存在语音识别率下降的问题。因此,如何减小混响效果的影响,降低训