基因转录调控模体预测的研究及其在线服务开发

被引量 : 0次 | 上传用户:rgzgjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学的发展提出了很多计算问题,通过计算方法预测基因的转录调控模体是其中之一。模体(motif)是一组短片段,通常只有8-12个字符的长度。因为具有生物功能,所以相对于生物序列的其他部分不易改变。它具有序列保守性,可以在序列上识别。依据所研究的生物序列不同,模体可分为DNA模体,蛋白质模体和结构模体,本文工作主要是研究载有基因转录调控功能的DNA模体。它可以帮助生命科学研究者了解基因转录的调控机制,为药物和生物工程等多个领域做出贡献,为计算科学的研究者提供了研究热点。传统的转录模体预测问题是多序列比对的NP复杂问题,之前的预测算法大都基于启发式学习方法,实际运用的假阳性率较高。很多生物信息工具需要较低假阳性率,才能在生物研究中被有效使用。实验组之前开发的BoBro模体识别算法[46]可以有效解决这一问题,它通过模体信号之间的相互支持,在数据处理内部降低其他“噪音”影响的同时保证了预测的识别率。目前主流的模体识别算法(如meme[39])都实现了在线服务。为了推广该方法,本人的研究工作就是以此算法为基础,通过增加结果分析功能,在高性能集群上设计实现了web服务平台DMINDA(http://csbl.bmb.uga.edu/DMINDA/)。DMINDA的主要贡献在于:(1)对于给定查找到的一组调控序列和相应的对照序列,可以计算得到统计打分以及对应的统计显著p-value;(2)除了实现BoBro算法[46]对模体的预测,还对预测结果的进一步分析提供了模体扫描、比较、共作用分析等功能;(3)服务还实现了同DOOR原核生物操纵子数据库的链接,利用操纵子信息提取调控序列,结合生物系统发生关系准备数据。设计DMINDA系统除了具有实际软件开发能力,还需要了解相关研究的领域的知识,才能了解用户的切实需求。生物信息学研究领域开发了很多工具没有充分发挥其应有价值,结合实际需要利用web开发技术制作出有实用意义的在线服务,可以推广这些方法。科学研究成果通过web技术向广大科研使用者推广是计算机应用领域的重要研究方向,有人将之称为科学2.0。DMINDA在实验组之前工作的基础上,增加了后续分析工作的研究工具,通过对核心算法的重编程和再组织,实现了在150节点高性能计算集群的部署。利用DataTables等Jquery工具,设计了界面友好的操作页面。以该平台为基础,继续开发了基于生物系统发生关系的MP3模体预测算法和在全基因组预测调控子的方法,目前正在投稿。利用web服务推广科研成果,可以提高论文发表层次,增加论文的引用次数,它可以成为一系列后续研究的平台。本文回顾了模体的预测及其相关研究,介绍了DMINDA系统的设计、开发与运行。
其他文献
河流具有,盐水、发电、调节气候等重要功能,是生态服务功能正常发挥的重要保障。通过建立三维数学模型对羊曲河道进行水动力模拟,分析羊曲建库后水位、流速的变化以及对鱼类栖息
<正> 清暑益气汤,本李东垣方,原载于《内外伤辨》,亦见于《脾胃论》,其文云:“肘当长夏,湿热大胜,蒸蒸而炽,人感之多四肢困倦,精神短少,懒于动作,胸满气促,肢节沉痛,或气高而
文章针对钢结构跨海桥梁所处的海洋气候的特殊性,钢构件容易产生腐蚀这一现象.探讨了钢结构桥梁腐蚀机硎,提出了钢结构防腐措施——长效重防腐涂装及复涂工艺,该方艺是提高钢结构
本文介绍了居住区绿地景观设计的基本原则,居住区绿地的种类,以小区庭院景观配置和立体景观配置为重点,分析了住宅小区绿地景观的配置问题。
随着光纤技术的发展,光纤光栅传感器开始广泛应用于土木工程、建筑结构、安全监测等领域,与传统传感器相比,光纤光栅传感器具有高灵敏度、体积小、质量轻、抗电磁干扰等多种
我国中西部城镇化相对滞后,县域经济及县域城镇化发展缓慢是其主因,在国家提出“新型城镇化”战略、“引导约1亿人在中西部地区就近城镇化”的背景下,县域城镇化特征及规律受
<正>进入新世纪以来,国家政策上的倾斜和实际工作中的优先原则无疑为女性干部的从政之路奠定了较好的基础,特别是在一系列高度重视培养选拔女性干部的方针政策的扶持下,越来
随着国际航运市场的持续低迷,国内自由贸易区的陆续批复,天津国际航运服务改革迫在眉睫。本文对天津国际航运服务的发展进行梳理,在借鉴国内外港口国际航运服务发展经验和教
大学生群体分类引导思想日益成为高校思想政治工作者的共识。以社会学群体理论视角解读新时代大学生群体可以发现:大学生群体基于思想认识和价值观的不同而不断加剧的内部"冲