基于隐马尔可夫模型的基因识别系统的设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:Stephanie1121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过Baum-Welch算法能够得到基于当前训练序列的模型参数.当遇到许多具体情况时,如训练数据不足、多个训练序列等,有必要对经典的训练算法进行一定的改进,使系统在特定的情况下的性能有所改善. 在经过训练建立起隐马尔可夫模型以后,就可以用这个模型来解析新的DNA序列.这里,通过Viterbi算法来完成这个任务.给定一个训练好的隐马尔可夫模型,Viterbi算法将利用这个模型找出给定DNA序列的最有可能的状态序列. 利用上述模型的一种基因识别系统被提出.在这个系统中,各个基因区域的分析模型包含丰富的生物学规律.整个系统使用模块化的结构,因而十分灵活,可以在系统中很方便的增加新的模型,以检测新的基因区域.而且可以在现有模型中增加或者减少状态,以适应不同生物的模型结构.通过使用Burset&Guigo提供的学术界公用的570个脊椎动物基因序列进行验证,系统核苷识别的Sn和Sp两个参数分别达到68﹪和88﹪,外显子识别的Sn和Sp参数达到60﹪和63﹪.
其他文献
系统功能的实现需要控制台、阵列、客户端之间的通信与协同,为此需定制专用的数据传输协议,构建在基于IP技术的网络上,是整个系统实现的基础.该系统最大的特点是客户端功能的
本论文的研究是云南省科技厅国际合作计划的基金资助项目“新型人机接口—电子笔多功能网络视频会议实时通信技术的研究开发”的一部分。该研究项目主要由面向多功能手写笔的
文中对银行计算机系统存在的安全隐患做了详细地分析,并针对计算机安全存在的薄弱环节,全方位地探讨了计算机系统安全解决方法.在此基础上,设计出网络级、系统级、应用级三个
1.研究背景 随着Internet/Intranet技术的日趋成熟和普及,越来越多的政府、企事业,特别(?)一些跨地域大型企业、跨国公司等都积极采用新技术,通过Internet/Intranet将部署(?)各
网格是一种新型而复杂的分布式计算系统,传统的资源管理和任务调度方法往往不能很好的应用于该计算环境.为此,我们利用效益函数的概念把Min-min和Sufferage两种启发式独立任
现代软件开发采用工程化的方法对开发活动进行管理,重视对质量的控制,采取相关的措施降低开发风险。 建模是软件开发的一个基本的活动,统一建模语言(UML)的出现使不同类型、
模糊逻辑与神经网络的融合技术是近几年来学术界与工程界非常关注的研究领域,神经元网络擅长于识别模式和按变化的环境进行自适应变化,而模糊推理系统则在对人类知识进行推理
随着我国进一步加快教育信息化和现代远程教育工程的发展,规范教育信息技术和Web教学资源的开发工作,实现优秀教学资源的整合和共享,已成当务之急。在此背景下,如何建立一套通用