模体发现问题中投影算法的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:JACK910680
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在DNA序列中,模体(Motif)就是指DNA序列中保守的序列片段,而从DNA序列中发现这些模体的过程就是模体发现(Motif Discovery),模体对DNA的转录翻译起着重要作用,因此模体的关联分析对研究基因表达有着重大意义和理论价值。   本文首先对模体发现问题的基本建模方法进行了分析,并且对基于不同模体模型的模体发现算法进行了研究和分析,着重讨论了基于投影技术的随机投影算法与均匀投影算法,相比较于随机投影,均匀投影算法采用了一种贪婪的启发式的方法来近似的覆盖所有的投影,从而比随机投影在算法的效率和精度上有更好的表现。此外,本文在对判据搜索算法深入研究的基础之上,提出了一种基于判据筛选的均匀投影算法。该算法通过对均匀投影得到的有效桶进行判据筛选,滤除掉大部分的干扰桶,减少了用于建模与优化的有效桶的数目,从而提高了算法的性能。通过对算法进行的理论分析和仿真试验研究表明,它能够很好的发现生物序列中所蕴涵的模体。该算法也可以应用于所有投影算法应用过的其它领域,比如:蛋白质序列的比对等。
其他文献
近年来,随着数据的飞速增长,以DAS、NAS、SAN为代表的存储网络系统成为大多信息系统的数据存储中心。随着存储系统的网络化趋势,存储系统逐渐成为恶意攻击者的重要目标,攻击
随着互联网的发展和人们生活水平的提高,电子商务成为了一种时尚和潮流,随之也产生了不少以商品为中心的推荐系统,这类推荐系统利用用户的浏览(购买)记录来给用户其可能想了解或购
随着近年来我国教育水平的提高和国家及各教育机构对人才培养的重视,教育相关的数据量逐年增加。在关于教育信息的申报和评审类系统中,需要对申报的关键信息进行重复检查,以保证
当今是高速发展的信息时代,互联网作为这个时代的重要标志,已经渗透到人类社会的各个领域,互联网的核心TCP/IP协议更是在人们日常的网络信息交换中起到了至关重要的作用。然
近年来,对于视频序列中人体运动行为的视觉分析是计算机视觉领域中日益受到重视的一个研究方向。随着时代的进步,这项技术也在不断的发展完善,在未来必将有广阔的应用前景并
软件测试是保证软件质量的一个重要手段。随着面向对象技术的广泛应用,特别是基于统一建模语言(UML)软件开发技术的逐渐普及,为了满足软件测试自动化的要求,基于UML的面向对
随着人类基因组计划的开展与现代生物技术的迅猛发展,生物信息数据的增长呈现爆炸之势,这为揭开生命奥秘提供了数据基础;计算机运算能力的提高和国际互联网络的发展使得对大规
随着移动互联网时代的全面来临,智能手机与平板电脑日趋大众化,移动智能终端已经成为接入移动互联网的最佳入口。互联网、电信网和广电网内容不断相互渗透,逐步形成三网内容业务
移动机器人可以代替人到各种艰苦、危险的野外环境中执行任务,而野外环境具有复杂性、多变性、随机性等特点,为了保证机器人安全、有效的完成任务需要保证地形分类的实时性和适
神经网络集成是目前机器学习的热门研究方向之一,在许多领域有着广泛的应用,如数据挖掘、模式识别、文本分类、预测等方面。神经网络集成通过训练多个神经网络并将其结果进行