非编码RNA的计算识别方法研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:whp6356
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
有关非编码RNA的研究是功能基因组时代研究的重要前沿问题之一。本论文运用生物信息学方法,围绕着非编码RNA的计算识别与特征分析展开研究,主要包括三个方面的内容:针对microRNA(miRNA)的计算识别方法,非编码RNA的计算识别方法,以及RNA二级结构的相似性搜索。   1)miRNA是一类能够调控基因表达的非编码RNA。miRNA前体可以形成特殊的茎-环结构。然而,基因组中存在大量的与miRNA前体具有相似结构的序列片断(本文称为虚假-miRNA前体)。区分真实的和虚假的miRNA前体,不仅对理解miRNA的本质十分重要而且可以帮助开发识别miRNA的预测方法。本文提出了一种基于茎-环结构的局部结构序列特征,用于描述miRNA前体。利用这个特征,分析了miRNA前体和虚假-miRNA前体之间的差异。进而,将模式识别中的技术——支持向量机(SVM)用于两类数据的分类,取得了很好的效果。此外,还分析了不同物种的miRNA前体在局部结构-序列特征下的保守性,并提出了不依赖于比较基因组学方法的miRNA识别策略。   2)非编码RNA基因直接产生功能性的RNA分子而不是翻译成蛋白质,它们参与许多重要的细胞调控过程。非编码RNA基因不具有类似于编码蛋白质基因的开放阅读框和密码子偏好等明显的公共特征,因此计算识别非编码RNA是一项非常困难而重要的任务。本文提出了基于整合的特征识别非编码RNA的策略。应用这个策略,在人类基因组中,利用基因间区的低表达的EST数据,结合EST聚类、比较基因组学、转录信号分析等方法,预测了高可靠的非编码RNA基因,并对部分结果进行了实验验证和分析。   3)许多非编码RNA具有进化上保守的二级结构而不是进化上保守的一级序列。已经报道的结构比对方法在双序列、多序列中寻找保守的二级结构。一个开放问题是:给定一个已知结构的RNA序列,在大的数据库中搜索与该序列具有相似结构的序列。针对这个问题,本文开发了算法RScan。与原有方法相比,RScan可以在单机条件下快速的执行,并且保持了较高的准确度。最重要的是,RScan可以真正的应用于现实的使用,完成大数据库的搜索。
其他文献
模糊神经网络兼具模糊系统良好的知识表达能力和神经网络强大的自学习能力,成为神经网络和模糊系统领域的重要分支之一,在系统辨识、模式识别和智能控制等场合得到了成功的应用
直流无刷电机由于其既具备交流电机的结构简单、运行可靠、维护方便等优点,又具备直流电机的运行效率高、无励磁损耗以及调速性能好等优点,因此在伺服系统中得到了广泛地应用。
学位
柔性交流输电系统(Flexible AC Transmission System—FACTS)的出现为现代电力系统的安全、经济、可靠和优质运行提供了十分有效的手段,成为近年来一项有效改善电能质量的新兴
遥操作机器人作为机器人科学的一个重要分支,一直得到了人们广泛的关注和重视。在操作者与控制对象之间存在空间距离间隔的情况下,遥操作机器人系统可以通过人与机器人的同步交
随着人类活动范围的增大和现代社会对安全要求的提高,传统的基于标志物或口令的身份鉴别方法由于其自身的缺点已经不能满足社会需求,于是基于生物特征识别的身份鉴别方法应运而
本文研究了双向联想记忆(BAM)神经网络的稳定性和周期解。首先通过分解方法将神经网络的连接权分解为激活和抑制两部分,并对其进行对称变换,得到的系统结合原来的神经网络构成
简易制导炸弹飞行控制系统的任务就是在飞行过程中实现对炸弹的控制,根据实际飞行弹道与方案弹道数据的偏差量,通过控制规律形成舵偏量,驱动舵机作相应的偏转,进而控制炸弹稳定地
快速准确的面向预定目标位置的导航(如:归巢和觅食)是高等动物赖以生存的一个重要能力。生理学研究表明鼠脑中的海马结构是空间认知的核心脑区,在陈述性记忆和空间导航方面有
本文对舵机测试电磁加载装置进行了研究。文章提出的舵机加载装置由工业控制计算机、磁粉制动器、动态扭矩传感器、单通道实验舵机、高灵敏度电位器等装置组成,构成了位置和扭