定长生物序列特征串预测问题的最优化算法研究

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:hopehappy501
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成及各种高通量生物学实验技术的发展,生物学数据急速增长。纯粹靠手工来对这些数据进行分析整理和使用是难以想象的,科学家们需要利用现代计算技术对这些数据进行收集整理、分析和使用。在当前生物信息学中,计算学方法越来越受到重视。  蛋白质翻译后修饰位点预测问题和DNA转录因子结合位点预测问题一直以来都是生物信息学中研究的热点。蛋白质翻译后修饰在生命体中具有十分重要的作用。目前一系列针对蛋白质翻译后修饰位点预测的计算智能领域的算法已经被提出,其中最为著名的当是GPS算法。基因表达调控方式中最主要的是在转录水平上的表达调控,转录因子对此起着决定性作用。因此对于转录因子结合位点的预测是理解和分析基因组的重要工作之一。目前已经提出了许多计算学方法来对转录因子结合位点进行预测。如Gibbssampler,MotifSampler,Motifcut等。  本文根据这些现有已被实验验证的数据的Weblogo信息熵图,提出一种权重打分策略WSS,并利用数据的Weblogo图得到初始权重。在此基础上,利用遗传算法对初始权重进行了优化,进而提出了Echo算法。我们分别选取了多种蛋白质翻译后修饰作用数据和多种转录因子结合位点数据进行实验,验证了这两种算法。实验结果表明WSS算法性能与GPS算法和PWM算法性能接近,而经过优化后的Echo算法的性能更是大大提高了预测准确性。在两类数据上的成功试验说明了本文的算法有很好的适用性。  最后,基于Echo算法及其实验结果,开发了一款图形界面可视化分析软件,集成了经Echo实验后得到的最优结果。此软件有良好的用户友好性和可扩充性,可以成为生物信息学科研人员的得手利器。
其他文献
在间歇性连接的机会网络中,移动车辆节点携带通信数据形成车载容迟网络(Vehicular Delay -Tolerant Networks),通过携带—存贮—转发机制缓存数据,进入目标节点通信范围后进
二维网状结构的处理器阵列具有简单、规整的特性,在实际的应用中具有良好的性能,因而被广泛应用在信号、图像处理等复杂数据计算领域以快速、高效地实现数据处理。随着技术的发
近年来随着信息管理系统的广泛应用和互联网技术的不断发展,以图像来保存的票据越来越多,主要应用于政府机构或者企业的办公系统、医院信息系统和电子金融管理系统诸多领域,每天
图划分的应用背景极其广泛,包括软硬件协同设计、大规模集成电路设计和数据划分等领域。其实,从图划分的众多应用背景来看,图划分问题是某一类问题的集合,即将一个给定的图的顶点
传统的信息系统安全性研究都是基于入侵阻止和入侵检测思想的,关注的主要是对入侵事件的防范工作,虽然通过各种先进的安全措施可不断提高系统的安全性,但还是不能百分百的阻
随着区块链技术的成熟与发展,区块链技术的应用已经不仅仅局限于数字加密货币,在电力、交通物流、物联网、金融、供应链和医疗数据等方面出现了越来越多的相关应用。以区块链技术为基础的以太坊、超级账本等项目逐渐成熟深化,推动了对区块链安全性需求的多样化发展,超级账本的Fabric项目作为最早脱离数字加密货币体系局限的实用项目,推动了区块链技术在政府、金融、企业等层面的应用与发展。但随着区块链相关应用的多样化
学位
从现有的图像描述和大规模近似图像搜索方法主要是基于全局特征和基于局部特征两大类。由于局部特征能够更好的展现和利用局部图像的图案和纹理,流行的BoW和词汇树方法在找寻
几何造型是研究在计算机中如何表达物体模型形状的技术。参数曲面造型和细分造型是几何造型的两个重要技术。参数曲面造型从上世纪60年代Bezier曲线曲面开始发展,70年代发展的
随着网络技术的快速应用与发展,网络安全问题日益突出。传统的防火墙与入侵检测技术已无法满足网络安全问题的需求,因此,入侵防御系统(Intrusion PreventionSystem,IPS)应运而生。
由于网络数据的海量增长、数据仓库和OLAP的飞速发展以及商务数据分析的需求,在海量数据存储和分析方面占有优势的列存储得到很快的成长。但以列为导向的物理层存储结构意味着