在高通量测序背景下对于识别编码蛋白RNA和长非编码RNA的研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:maodaiwan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来高通量测序技术在全球范围内被广泛应用,对于高通量测序技术重新构建出来的转录本,特别是来自于没有完备基因注释的物种的转录本来说,对其属于编码蛋白RNA还是非编码RNA进行分类,是一个项非常紧迫的任务,同时也是一个巨大的挑战,该工作也是接下来RNA功能研究或者调控网络研究的重要前提。相邻的核苷酸三聚体的出现频率在编码RNA和非编码RNA中存在显著的偏好性,基于此偏好性,本文引入动态规划算法、提取出分类特征,使用人类的已知转录本序列数据训练了一个支持向量机分类模型,并且开发了一个分类功能显著的应用软件:CNCI(Coding and Noncoding Index)。在后期的验证中本文参考了大量的带有注释信息的RNA序列进测试,证实了CNCI具有非常高的分类精度,可以应用到高通量测序数据所产生的大量转录本数据上。为了测试模型的适用范围,本文将CNCI应用到多物种的全转录组测序所重构的转录本上,通过对脊椎动物、非脊椎动物和植物的转录本进行了大批量的实验,并且发现脊椎动物的相邻核苷酸三聚体基本属于同一个模型,但是该模型并不适用于非脊椎动物和植物,这也从另一个层面展示了物种之间一种进化趋势。最后,我们将CNCI应用到人类和红毛猩猩的长非编码RNA的鉴定工作中,重新注释了红毛猩猩的转录组,并且对鉴定到的人类长非编码RNA做了可靠的功能预测分析,对其长非编码RNA的注释工作做了重要的补充。
其他文献
讨论了冷却至固液两相区内开始搅拌与连续冷却搅拌工艺对半固态Al-25%Si合金组织演变的影响。结果表明,机械搅拌可以破碎在合金液中析出的、生长到一定尺寸的初晶硅;破碎后的
根据240 mm×280 mm 45钢的实际生产条件,建立基于射钉和测温的方坯凝固传热数学模型。分析了拉速、过热度、二冷强度等参数对铸坯温度和凝固坯壳厚度的影响。结果表明,
目的对253例符合不明原因发热(FUO)诊断标准患者的临床资料进行总结分析,明确FUO的病因和临床特征,以提高对疾病的诊治水平,为今后的临床诊治提供帮助。资料与方法1、研究对
本文介绍我院"数字电子技术基础"课程组突出以学生为中心的教育理念,以能力培养为导向,提出并实施了基于SPOC的翻转课堂+PBL的混合式教学模式,激发学生的学习热情,提高学生工
破碎机前端是破碎机中的关键部件,它在工作中承受很大的冲击载荷,铸件质量要求严格
<正> 道家思想是中华文化之精髓,它对中华文明的发展以及传统道德的塑造,中国武术功夫的修炼皆给予理论上的指导。可以说中国剑术理论,就来源于道家思想。本文就“道”与中国
公共舆论监督是国家治理监督体系的重要组成部分,社会媒体关注审计结果是国家审计参与国家治理的重要外部机制。国家审计通过审计结果公告制度向社会公开审计发现的问题,借助
区域化、全球化有其特定的含义。区域化是国家化与全球化的过渡,区域化的类型制约着全球化的结构模式,区域化的性质制约着全球化的发展趋势,现实全球化的发展趋势、人类社会
对医学生在实习前阶段进行职业道德教育,让医学生充分认识到职业道德教育的重要性及必要性,保持良好的职业道德素养进入临床实习工作,临床实习工作中,再由带教老师言传身教,
目的 深入研讨西药房高危药品的管理现象,并提出用药安全的决策性建议。方法 随机筛选于2016年1月至2018年1月到我院西药房进行治疗的120例患者,根据不同时间段平均分配为