基于支持向量机的A-to-I RNA编辑的计算机识别及组织特异性研究

来源 :中国人民解放军军事科学院 | 被引量 : 1次 | 上传用户:sunleilong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着后基因组时代生命科学研究的不断深入,认为不同物种的基因组规模和蛋白编码基因数量决定了物种复杂度和多样性的传统认识不断被挑战,基因调控的重要性不断凸现,而近几年大量全新的行使调控功能的非编码RNA的突破性发现使得RNA层次调控在整体调控中的重要性也与日俱增。本论文选取一种重要的转录后调控事件—RNA编辑为研究对象,围绕新编辑位点识别和已知编辑位点的组织特异性分析进行生物信息学研究。RNA编辑是发生在前体mRNA上的单个或多个核苷酸的替换、插入或删除。RNA编辑通过对转录序列“重编码”来调控基因的表达。目前研究最多的是两种替换类型的RNA编辑:C-to-U RNA编辑和A-to-I RNA编辑。前者主要存在于植物的线粒体中,而近几年的研究表明在哺乳动物中A-to-I RNA编辑事件广泛存在。A-to-I RNA编辑由编辑酶ADARs介导,特异性识别双链底物上的腺嘌呤(A),经脱氨作用将其转变为次黄嘌呤(I),而次黄嘌呤在翻译过程中被识别为鸟嘌呤(G)。A-to-I RNA编辑可新建或破坏剪接位点、调控元件等;可改变蛋白质翻译密码子进而影响蛋白质活性功能;异常的A-to-I RNA编辑可导致疾病发生。目前研究表明超过50%的人类基因组均被转录,相对于数量巨大的转录序列,已被识别的A-to-I RNA编辑位点仅在几万这个数量集,暗示了仍有大量全新的A-to-I RNA编辑位点未被发现。传统识别A-to-I RNA编辑位点的计算方法主要依赖mRNA/EST等转录数据与相应基因组DNA序列比对发现A-to-G差异位点,此类算法受限于转录序列的丰度、测序质量,并且要求物种基因组已测序。利用机器学习算法开发不依赖比对数据,仅基于单一转录序列的A-to-I RNA编辑位点识别方法是本论文工作的目标之一。根据这种指导思想,我们构建了基于支持向量机的A-to-I RNA编辑位点分类器。将分子实验验证的非重复区域的编辑位点作为训练数据集;提取编辑位点上下游序列的碱基组成、序列保守性、RNA二级结构三方面的信息构建特征向量;使用Libsvm对支持向量机进行算法实现。通过留一法进行评估,分类器的总体正确率在80%左右;绘制ROC曲线计算其曲线下面积(AUC)为0.85。在独立测试集数据对分类器效果进行评估时,总体正确率是70%;ROC曲线评估得到的AUC约为0.75。调控事件的时空特异性是增加调控复杂度的更要机制之一,已有文献通过个案研究证实了RNA编辑存在组织特异性,且差异性的RNA编辑事件发挥着重要的生理功能。为了发现更多组织特异的RNA编辑位点,从而揭示RNA编辑组织特异性的内部机制和功能影响,我们基于统计学算法开发了系统识别组织特异的RNA编辑位点的方法,并成功应用于人类组织特异的A-to-I RNA编辑位点识别。根据文献报道,我们收集了32316个非冗余的A-to-I RNA编辑位点、mRNA/EST与基因组的比对数据以及cDNA库的组织来源等信息。构建了基于贝叶斯公式和Fisher精确检验的组织特异编辑位点识别的统计学模型。通过该模型我们识别了340个组织特异的A-to-I RNA编辑位点。为保证结果的严谨性,我们采用FDR方法对计算结果进行多重检验,最终23个编辑位点仍具有统计学意义,这23个位点分散在14个组织中。对这些位点进行初步的基因组位置分析发现,除了两个位点落在基因CDS区,绝大多数的编辑事件都发生在基因的3’UTR区域上。本课题通过机器学习的方法建立了第一个支持向量机的A-to-I编辑位点分类器,该分类器为预测低丰度转录区域编辑位点以及建立不依赖于转录组数据的编辑位点识别软件奠定了基础。该分类器通过留一法以及ROC曲线方法进行评估,取得了较好的分类效果,但在独立测试集上分类效果不佳。下步工作需要从挖掘新的分类特征方面入手,由此提高分类器识别正确率,此外,发现更多编辑位点充实训练集数据也有利于分类正确率的提高。另外,我们第一次使用统计学手段识别了批量的组织特异性的编辑位点。这为研究A-to-I RNA编辑事件的组织特异分布机理以及生物学影响提供了数据基础;也为研究其它组织特异的调控事件提供了方法学的借鉴。但对于该模型的识别效果仍需分子生物实验进行评价。
其他文献
透明质酸广泛存在于人体中,是细胞外基质的重要成分,具有独特的流体力学性质、良好的黏弹性和应变性。目前透明质酸被广泛用于生物材料、药物靶向制剂、美容以及腹部手术后预防黏连等。随着透明质酸应用范围的扩展及新型医用材料的不断涌现,近年来对透明质酸的研究日益增加。本文对透明质酸的临床应用及其作用机制进行综述,以期为透明质酸产品的进一步研发和安全应用提供参考。
安源精神源发于中国共产党领导的安源工人运动,是马克思主义中国化的早期探索,是伟大建党精神在新民主主义革命时期的具体样态,更是中国共产党践行初心、担当使命的生动实践。安源精神为建党以来不同历史时期的革命、建设与改革提供了重要精神动力。课题组认为将安源精神内涵修正为“义无反顾、敢为人先、团结群众、英勇斗争”,并促成学界对安源精神基本内涵达成高度共识,这是在新时代传承与弘扬安源精神的重中之重。
物理是一门以实验为基础的自然学科。实验教学是物理教学的重要和核心内容。科学、高效的实验教学对促进学生积累学科知识、培养学生物理思维与知识应用能力等具有积极的作用。低成本实验教学是一种先进的教学方式,具有"一低三不低"的特点,可有效弥补物理实验资源缺乏、部分实验危险性高等缺点,具有较高的应用价值,对提高物理实验教学的有效性裨益较大。
文章以市政雨污水管网分流改造工程为背景,分析雨污水排放设施的现状和主要问题,提出改造思路,探讨相应的解决办法,希望能为相关工程提供参考。
由于独特的社会人文条件,宜昌地区中共党组织在早期创建过程中形成了自己的特点:一是地理位置带来的交通不便的缺点,致使该地经济落后,思想封闭,马克思主义传播困难,造成了中共党组织创建滞后的特点;二是宜昌地区地形丰富,经济发展、文化教育程度不同造成了中共党组织建立和发展的不平衡性;三是宜昌地区有部分属于少数民族聚居区,在中共党组织发展过程中,土家族爱国传统以及骁勇善战的民族性格与共产党领导的革命武装斗争
化学是一门在分子、原子等微观层面研究物质性质、结构与变化规律的自然科学,在初中各学科当中始终占据着主导位置。学好化学的先决条件是理解和掌握化学实验原理、理清化学实验步骤、理性认知和解释各种化学实验现象。在初中化学实验教学中,教师应当有效运用和开发教材资源、生活资源及辅助资源,为学生营造一个轻松、高效、生动、有趣的化学实验课堂氛围,进而为学生学好化学知识打下坚实基础。
期刊
医学免疫学是一门实践性很强的学科,实验课的教学是整个免疫学教学中的重要组成部分,实验课不仅可以验证学生在理论课学到的理论知识,而且还能有效训练学生的基本实验技能、培养学生的科学思维和临床思维能力。将传统的教学手段与在线教学方案结合起来,旨在突破传统实验教学内容与方法的局限,利用慕课、虚拟仿真、学习通等在线教学模式的特点解决免疫学实验课程教学资源有限、课时少的缺点,可以有效提升教学效果,培养创新实践
迪士尼在全球范围内搜集公主故事,打造了一个汇聚全球流量的“迪士尼公主”集合体。从1937年到2020年,迪士尼共上映了 13部动画公主电影和5部真人公主电影,这些电影一方面映射着不同历史时期对女性的不同期待,另一方面也在不断书写和重塑女性话语、重估两性关系。“迪士尼公主”塑造了什么样的女性角色,反映了什么样的女性标准,八十余年来这些角色和标准发生了怎样的变化,变化背后的社会动因又是什么,本文尝试予
为响应新冠肺炎疫情期间教育部"停课不停教,停课不停学"的号召,依托现有线上教学平台,结合国际货运代理课程的特点,进行基于"超星平台+腾讯会议"的课程线上教学研究,保证疫情期间正常教学活动的同时,进一步促进了教学改革,提升了教学效果,推动了信息技术与课堂教学融合发展。
毛泽东在《湖南农民运动考察报告》中热情讴歌湖南农民禁烟运动,在古田会议决议中把"不吃鸦片"作为入党的条件之一。周恩来在东江地区禁烟毒是中国共产党人第一次领导地方禁毒工作。大革命时期,李立三、彭湃、韦拔群、贾力更等领导了工农禁烟运动。土地革命战争时期,叶季壮、张鼎丞、方志敏、熊国炳等在苏区禁烟毒。抗日战争、解放战争时期,霍维德、王凤斋、王世泰等是党领导的禁毒机构的负责人。