基于机器学习方法的外显子跳跃事件研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:ycx20080907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因选择性剪接是一个复杂多变的过程,它将移除内含子序列并重组外显子序列以产生成熟的mRNA(Messenger Ribonucleic Acid)。基因选择性剪接使得一个基因可以编译多个RNA(Ribonucleic Acid),而每个RNA又可以控制多个对应蛋白质的合成和功能的表达,因此出现了有限基因和近乎无限蛋白质的现象,基因的这种特性造就了地球上生物的多样性。然而基因选择性剪接的一些非正常的组合排列很可能诱发各种用常规手段难以治愈的致命遗传疾病,为人类生存带来巨大的灾难。因此对它的继续深入分析研究是必要的。基因选择性剪接通常可划分为5种不同类型,其中外显子跳跃(exonskippin&,ES)事件是最大的一类选择性剪接事件,约占所有类型的40%以上,这使得它的分析预测和研究成为选择性剪接的重点。经过多年的分析研究,至今为止已经提出了数量众多的分析预测外显子跳跃事件方法,通常可以将它们划分为传统生物实验方法和生物计算方法两大类,然而传统生物实验方法通常有耗时、耗力、昂贵且有限覆盖等局限,不太适合用于大规模分析,所以使用生物计算方法分析预测外显子跳跃事件越来越受到欢迎,并且其取得成绩也越来越受人信赖。通过对以往预测外显子跳跃事件方法的研究学习,我们发现了它们中存在的一些局限,即RNA-Seq(RNASequencing)数据和基因序列信息的不完整性,这可能会给外显子跳跃事件预测带来不可预期的风险。为了克服这些局限,本文则基于RNA-Seq数据、基因序列信息以及旋转森林提出一种预测外显子跳跃事件的新颖生物计算方法。在该方法中,本文重在发挥两种数据各自优势,抽取能够描述外显子跳跃事件的特征,进而对外显子跳跃事件进行分析预测。首先,我们构造一个新的名为 RS(the RNA-Seq features and sequence features)的特征集,它是由从RNA-Seq数据中抽取的RNA-Seq特征和由基因序列信息里抽取的序列特征组成。然后基于RS特征集,结合旋转森林算法(RotationForests,RotaF),我们提出一个新的名为 RotaF-RSES(a Rotation Forests classifier predicts ES event with RS features)的外显子跳跃事件预测方法。为了验证RotaF-RSES方法的有效性,实验中采用两种人类组织RNA-Seq数据(人脑和人类肌肉)和对应的基因序列信息,结果表明RotaF-RSES方法能在一定程度上克服两种数据的局限性,并提升最终的预测准确度,能够为预测外显子跳跃事件的研究提供有益的帮助。
其他文献
采用氩等离子体辅助接枝改性方法在聚丙烯(PP)材料表面接枝水溶性高分子聚乙烯基吡咯烷酮(PVP)。衰减全反射傅立叶红外光谱(FTIR—ATR)和X射线光电子能谱(XPS)分析结果证明PP表面成功
急性和慢性肝脏炎症和损伤均能激活肝星状细胞(HSC),但慢性肝炎时HSC大量扩增,导致肝纤维化,慢性胰腺纤维化的发生过程与之类似。在肠管中,急性和慢性损伤均可有黏膜内间质细胞激活
不论是在本土的,还是海内外的潮商,初创业、上规模、求发展,一切的商业运作都离不开资金的支持。汕头应当发挥现有优势,大手笔解决遗留问题,创造良好投融资环境,努力打造区域金融中
非洲是中国对外合作的重要区域,特别是“一带一路”倡议提出以来,中国为促进非洲的经济增长和工业化发展注入了强大动力。据初步统计,“中国企业在非洲已建成和在建的项目,将
针对目前科间会诊中存在的会诊不及时、会诊指征掌握不严、会诊质量较低等问题,采取细化会诊管理制度、优化会诊工作流程、建立会诊质量考评机制等改进措施,使会诊及时率从原来
为了解决公交实际运营出现的调度方式单一、车辆配合度较差、串车等问题,降低公交运行中人为因素的影响,提高公交系统的运营效率,提出一种考虑乘客动态需求的调度模型,采用自
膜生物反应器(MBR)是近些年发展起来的一种新型污废水处理技术,其将传统的生物法与膜技术高效地结合在一起,具有显著的处理优势。但是在MBR中存在的一系列膜污染问题,制约了MBR的广泛应用。聚偏氟乙烯(PVDF)膜是MBR中应用最为广泛的膜材料。但是由于其较差的亲水性和较低的表面能,使得PVDF膜在MBR中极易形成吸附性污染和滤饼层污染,严重缩短了膜的使用寿命,增加了运行成本。为此本课题采用等离子体
采用丙烯酸和丙烯酰胺为单体,对聚丙烯中空纤维膜表面进行低温等离子体表面处理并引发接枝反应。红外拉曼光谱(FT-IR)分析结果表明,丙烯酸(AA)和丙烯酰胺(AM)分别接枝到膜表面。设
目的:建立同时测定小儿至宝丸中可溶性砷、汞含量的方法。方法:采用人工胃液37℃振荡提取.原子荧光光谱测定小儿至宝丸中可溶性砷汞的含量。结果:砷在2~20ng·mL^-1。之间,汞在
提出了根据瓦斯储量计算半径的方法,并通过现场布置钻孔,进行了监测和计算。根据计算和验算发现,测定结果与实际情况基本一致。但是,结果显示,抽采时间较长,仍需要对钻孔施工