模体发现问题的若干算法及应用研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ilovelp222222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文首先介绍了生物信息学研究的背景,以及相关领域的发展情况。详细讨论了生物信息学中研究DNA模体发现的一个重要的模型,也就是植入(l,d)-模体模型,该模型下的l、d的某些组合构成了“挑战问题”。随后本文对植入模体模型中的“挑战问题”进行了概率分析,并根据植入(l,d)-模体发现问题中存在随机生成模体的数学期望大小,划分出可解问题与不可解问题的分界线。在分界线附近的部分植入(l,d)-模体发现问题就成为了植入模体发现的“困难问题”。Buhler和Tompa提出的随机投影模体发现算法较好地解决了植入模体模型下的大部分“挑战问题”。本文细致地描述了随机投影模体发现算法的众多细节,并针对随机投影算法中的建桶以及桶搜索提出了基于哈希表的改进方法,并进行了复杂度分析。实验结果表明改进后的算法在确保正确率的前提下,对算法的时间性能有了较大的改进。本文针对随机投影模体发现算法解决部分植入模体问题时的正确率的不足,基于提高算法随机性以及算法全局搜索能力的想法,提出了模体发现的GARPS算法。算法沿用随机投影算法中投影的思想,对投影后产生的合格桶所组成的种群施加特定参数的遗传迭代,输出最优的个体做为模体。通过实验表明,GARPS算法全面提高了查找植入模体的正确率,对于真实生物模体GARPS算法也能进行完全正确地识别。
其他文献
Mashup是一种新型的基于Web的数据集成应用程序,利用从外部数据源检索到的内容创建全新的创新式服务,组合多个数据源的内容,创造出增值的服务。Mashup具有第二代Web应用程序
信息技术是一个快速更新和迅猛发展的领域,新技术和新思想层出不穷,系统模式和系统架构日新月异,项目管理、软件工程和系统开发设计方法等也都不断地推陈出新。随着互联网的
科学计算可视化是当前计算机图形学研究的重要方向,它将大量抽象的数据或计算结果用图形或图像形象、直观地表示出来,应用领域十分广泛。医学图像三维可视化是可视化技术在医
地面站是小型无人机飞控系统的重要组成部分,研究小型无人机地面站软件的实现方案、设计开发技术及关键技术问题的解决方法,对设计开发满足工程应用需求的小型无人机飞控系统
大数据时代,人类在生产、生活中积累了大量的数据,但是真正有用的信息却相对较少,急需发展大数据挖掘技术。国家“互联网+”战略的推进,将更为广泛的积累数据,尤其是互联网上
无线传感器网络融合了传感器技术、通信技术和数据处理技术;无线传感器网络因其巨大的应用前景而受到学术界和工业界越来越广泛的重视。本文首先对无线传感器网络进行了概述,
YHSIM是一个功能强大的实时半实物建模仿真软件平台。然而,目前基于YHSIM的模型解算只能在单核上运行,随着系统规模和复杂度的增加,在一个帧周期内要解算的模型越来越多、解
NP问题是计算科学中的经典问题,而所有的NP问题都能在多项式时间内归结为NP完全问题,NP完全问题具有相当的复杂性,为NP完全问题寻找一个多项式时间的解法成为了许多科学家的
随着网络技术的进步,Internet中的实际网络状况已非昔日可比,这不仅体现在网络带宽的快速增加,还体现在网络拓扑的异构化、网络协议的差异化、网络的无尺度化以及服务请求的
高性能计算机自诞生以来主要应用在两大领域——数据处理和数值模拟。数据处理方面以数据分类为主,朴素贝叶斯分类算法(NBC)是优秀分类算法之一。数值模拟涵盖许多领域如数值