基于演化硬件的DNA微阵列数据分类方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:huangshuhui1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于各种癌症在病原上有其自身的特点,为了达到最大疗效和最小毒副作用,需要制定有针对性的治疗方案,因此癌症的分类是治疗的关键。当前临床上的癌症诊断主要依据形态学信息,但有些在组织病理上相似的肿瘤也可能有不同的临床表现,需要截然不同的治疗方案。近年来,DNA微阵列技术的发展为癌症研究提供了一种新的途径,通过微阵列数据的表达值可以寻找基因之间的复杂关系,为研究癌症的发病机理、对其进行检测并筛选相应的治疗药物提供了依据。利用DNA微阵列数据对癌症进行分类已成为当前癌症研究的重点之一,但由于微阵列数据集具有小样本、高维度、高噪音、高冗余、数据分布不均衡等特点,也为基于DNA微阵列数据的癌症分类带来了巨大的挑战。由于DNA微阵列数据的独特性,使用常规的模式识别方法并不一定能获得理想的分类效果。针对当前基于DNA微阵列数据的癌症分类中存在的学习和识别时间长,学习结果可读性差等问题,为了更好地解决微阵列数据的分类问题并进一步提高系统的识别率,本文提出了一种基于演化硬件的癌症分类方法以建立一个高效、准确的分类系统。与结构和功能一次性固定、不可逆转的传统硬件电路相比较,演化硬件是一种基于可编程逻辑器件,通过应用演化算法能够自动的、动态的改变其自身结构和功能从而适应其周围环境变化的新型电子器件。演化硬件分类系统基于可编程逻辑器件的高效、快速等特性,具有可在线适应、实时性强、学习结果可读性好等优点。为了解决所提出的上述问题,本文在以下方面进行了深入研究。第一、针对单个演化硬件分类器存在的稳定性差、识别率低等问题,建立了用于微阵列数据分类的演化硬件多分类器模型。对DNA微阵列数据采用基于过滤的信噪比特征选择方法,然后使用虚拟可重构结构的演化硬件多次对数据集进行学习生成不同的基分类器,最后采用大多数投票法对多个基分类器的输出结果进行集成。为了降低系统的演化难度,在演化过程中采用了增量演化策略;同时使用流水线技术降低系统的演化时间。第二、为了降低系统的硬件资源消耗,并进一步提高系统的识别率,又引入了选择性集成学习方法。首先把原始训练集分为训练集和验证集,为了增加演化硬件基分类器的差异性进行了多次随机划分,通过对训练集的学习生成不同的基分类器;然后用对应的验证集测试基分类器的性能,并用演化硬件的输出误差作为评判基分类器优良的标准;最后对基分类器的误差值进行排序,选取误差值较小的基分类器用于最终的系统集成。对不同数据集的实验结果表明,该方法建立了一个稳定、高效的DNA微阵列数据分类系统。
其他文献
近年来,利用机器人或者计算机进行人脸识别已经成为人工智能与模式识别的一个重要研究课题,它涉及图像处理、模式识别、计算机视觉、神经网络及机器学习等多门相关学科。目前有
自动人脸识别是模式识别和人工智能领域最复杂和最重要的工作之一,可广泛应用于安全控制、监控系统、人机交互等领域。   近年来,人脸检测和识别领域取得了长足的发展。Adab
动态纹理(Dynamic Texture,简称DT)是指具有运动特征的纹理,它由在时间上呈现某种稳定性的图像序列构成。现实世界中存在着大量的动态纹理,如海波、烟雾、火焰以及飞翔的鸟群
实时数据流挖掘是数据挖掘领域中极其重要的研究方向。现代社会中随着计算机技术的飞速发展以及计算机应用的普及,实时数据流应运而生,它们具有时序性、快速变化,概念漂移、数据
网络用户对于信息获取、用户交流和个性表达需求的增加促进了一种新型社会网络的出现和发展,即在线社会网络。在线社会网络的高速发展使用户行为、关系、网络的结构和演化成了
随着无线Mesh网络的不断发展,规模越来越大,应用越来越广泛,提供的服务也越来越丰富,使得无线Mesh网络的路由机制研究随之成为了一个关注热点,而多径路由机制由于稳定性与整体路由
城市道路交通问题已经成为城市管理所面临的最大挑战之一,智能交通系统(ITS)被视为是最有效的解决方法和未来交通的发展方向。交通车流量统计是智能交通系统的关键技术之一,同
标注训练样本是文本自动分类中的基础和关键。大规模的标注训练样本需要人工干预,耗时、费力,难以在有限的时间内完成,而未标注文本却十分丰富。如何利用少量的标注样本和大量的
数字水印技术是利用信号处理的方法将具有特殊意义的标识信息(亦称为水印)嵌入到多媒体数据中,从而起到版权保护的作用。嵌入宿主数据中的水印应具有一定的抗攻击(有意和无意
智能视频监控是计算机视觉领域一个新兴的研究方向,结合了图像处理、模式识别、人工智能等多学科理论,被广泛应用于国防建设、交通管制、安防保卫等需要实时监控的场景。在监控