基于ART神经网络的基因表达数据分析

来源 :东北大学 | 被引量 : 0次 | 上传用户:zhuchao2549
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学作为一门新兴的学科,已成为这个世纪自然科学的前沿领域之一。在生物信息学的众多研究方向中,基因表达数据分析一直是一个亟待解决的问题。 基因表达是指基因中的编码信息被转换成行使特定功能的结构产物的过程。人们对于成千上万个基因在某一生命现象中的表达情况的观察,能够将基因的活动状态比较完整地展现出来,使得人们能够从基因组整体水平上把握生命的某些特征,理解生命发育过程。因而对于基因表达数据的分析对于寻找新的基因、确定基因的功能以及分子设计、生物制药等领域具有很重要的现实意义。 神经网络作为机器学习的重要方法,在生物信息学领域中取得了广泛的应用,尤其是生物序列的模式分析中,如蛋白质的分类、启动子的识别与分类等等。神经网络也同样被应用于基因表达数据分析中。相比其它机器学习方法,神经网络在这些应用中,具有高效准确的特点,同时也更符合数据的生物特性。 我们设计完成了利用神经网络自适应共振理论ART(AdaptiveResonanceTheory)对基因表达数据进行聚类的系统。自适应共振理论是一种典型的、无监督的、能够对复杂输入模式实现自组织识别的神经网络。我们在实现中着重研究了基因在不同表达水平上的同相位不可分问题,并根据实际问题对传统神经网络模型进行了结构改进。与传统神经网络模型相比,新型神经网络增加了伴随神经元和重置系统。在新型神经网络的工作流程中,输入模式的幅度被提取出来并被送到网络的警戒测试部分,使得输入模式的的幅度信息没有丢失,从而能够解决基因在不同表达水平上的同相位不可分的问题。实验表明,新型ART神经网络与传统ART神经网络相比,其Cmp和Sep指数略强于传统ART网络,分类质量较好;同时也够较好地根据同一基因的不同表达水平来确定基因的发育阶段,分类结果比较准确。
其他文献
现在普通用户已经将拍摄数码相片作为每次旅游聚会和各种活动的重要组成部分,这使得家庭数码相片迅速增加。日益增多的数码相片对高效的相片管理和检索技术提出了迫切的需求。
随着用户对互联网服务质量要求的提高,随时随地能够享受高质量网络服务已经成为人们的迫切需求。在这种环境下下一代互联网NGI (Next Generation Internet)随之而出,它为更快
宽带网络(包括无线接入)的日益普及为人们远程访问企业内部资源,实现移动办公提供了基础。但如何帮助人们实现方便的远程接入却始终没有得到很好的解决。SSLVPN是一种新兴
PACS系统是现代计算机系统和网络运用于医学影像的信息系统,其主要作用是实现放射科无胶片化和规范流程。DICOM标准是PACS普遍遵守的国际标准。miniPACS是PACS的一种类型,它
在行业软件开发中,架构的选择成为关系软件产品成败的重要因素。过去行业软件的开发以两层架构为主,由于这种方式具有开发方便、快捷的优点,在一定程度上加快了行业的信息化
本文通过分析信息家电、家电网络的现状与未来发展趋向,以ARM技术和嵌入式uCLinux操作系统为基础,通过合理的软、硬件设计,提出了基于嵌入式技术的家电信息网络平台的设计思想,构
近年来随着信息技术产业的飞速发展,嵌入式系统集成的功能日益复杂,应用也愈发广泛,但同时受到系统体积、成本、能耗、利用率等约束。为了克服这些问题,在现代嵌入式系统设计
该论文的主要贡献点包括以下几个方面:(1)该文针对业务冲突动态检测的特点,提出了一种支持业务冲突动态检测的形式模型,该模型能描述传统意义上不同种类的业务冲突,为从一般
介词短语是汉语中一种重要的短语类型。介词短语识别可以缩小句子中心动词的选择范围;可以简化句子结构,降低后续句法分析的难度;在基于模板的翻译中,它还能为模板匹配提供方
入侵检测系统是指能够自动识别计算机系统内的入侵行为的系统,它可以检测出非授权使用、误用和恶意攻击等异常行为模式。入侵检测领域中的数据记录具有数据量大、属性繁多的