基于相似性网络的疾病miRNAs预测方法研究及应用

来源 :湖南大学 | 被引量 : 2次 | 上传用户:yelangqishi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
核糖核酸(RNA)是存在于生物细胞以及部分病毒、类病毒中的遗传信息载体。RNA分为能编码蛋白质的编码RNA和不能编码蛋白质的非编码RNA。非编码RNA占人类基因组的98%,曾经被认为是“垃圾RNA”。随着研究的不断深入,人们发现非编码RNA的突变或者表达异常与许多疾病的发生密切相关。microRNAs(miRNAs)是平均长度约为22个核苷酸,具有调控功能的内源性非编码RNA,通过完全或者不完全碱基互补配对原则与特定靶基因的mRNA的3’端非翻译区或5’端结合,不仅能在转录后调控基因表达,也能在转录水平发挥抑制作用。miRNAs具有广泛的基因表达调控作用,参与细胞分化、增殖与凋亡,在心脑血管疾病、感染性疾病、恶性肿瘤等疾病中起到重要的作用。越来越多的证据表明一些miRNAs的表达谱在癌症组织与癌旁组织中呈现表达差异,各种肿瘤甚至癌症的不同阶段有各自特异性的miRNA表达谱。一些miRNAs可以成为癌症检测的标记物,或可能成为疾病治疗靶点,或成为疾病疗效预测指标。miRNAs与疾病的联系密切,识别miRNAs与疾病的关联,对于疾病早期检测、诊断、治疗、预后具有重要意义。本文从生物信息学的角度发掘miRNAs与疾病的关联,寻找与疾病最具关联潜力的miRNAs,希望能为生物实验提供最佳实验对象。本文主要工作如下:(1)首先研究了miRNAs的特点、功能、与之相关生物分子网络,接着研究了现有的与miRNAs相关的数据库资源,再研究了目前已有的疾病miRNAs预测方法,尤其是常用的基于相似性网络的疾病miRNAs识别方法,分析了这些方法的预测依据及优势与不足。(2)整合相似性网络的疾病miRNAs关联预测方法研究。目前已有的miRNAs与疾病关联预测方法存在一些不足,如预测准确性不高、需要负样本、留一交叉验证(LOOCV)的AUC值不高、验证时间长、不能预测孤立疾病(即没有miRNAs关联的疾病)等,为解决这些问题,通过整合miRNA相似性,疾病相似性和已知miRNA-疾病关联,本文提出了一种以相似性网络为基础的方法NSIM(network similarity integration method)预测miRNAs与疾病的关联。NSIM方法基于全局网络,合理简洁,不需要负样本,能够预测孤立疾病相关的miRNAs。(3)基于SimRank和密度聚类的疾病miRNAs关联推荐方法研究。本文提出了SRMDAP(SimRank and density-based clustering recommender model for miRNAdisease association prediction)方法,使用SimRank计算miRNA-mRNA间的网络拓扑相似度,以此构建miRNA相似性子网;并用疾病-基因网络间的网络拓扑相似度,构建疾病相似性子网。然后利用密度聚类推荐模型整合miRNA子网、疾病子网和实验验证的miRNA-疾病关联来预测miRNA与疾病的关联。SRMDAP中构建的miRNA相似性子网不依赖于已知miRNA-疾病关联信息,解决了预测结果过高估计的问题。SRMDAP还能预测孤立疾病相关的miRNAs以及孤立miRNA相关的疾病。(4)整合miRNA家族和簇信息的疾病miRNAs预测方法研究。在现有的很多miRNA-疾病关联预测方法中没有考虑miRNA的家族信息和簇信息。序列(特别是种子序列)高度同源的miRNAs被归为一个miRNA家族。同一个miRNA家族中的miRNAs并不一定位置相近。同一miRNA家族成员功能相近。miRNA簇是指在基因组上离得很近的miRNAs。miRNAs不是随机排列,通常是成簇的,而且簇生排列的基因常常协同表达。在miRNA-疾病预测算法中考虑miRNA家族信息和簇信息有助于提高预测的准确性。本文提出了FCMDAP(Using miRNA family and cluster information to improve predict accuracy of disease related miRNAs)方法,基于互信息,融合miRNA-mRNA相互作用数据和miRNA家族信息,计算miRNAs之间的相似性;融合疾病DAG语义和疾病-基因相互作用数据,计算疾病之间的相似性。然后,用推荐算法基于miRNA簇信息、已知miRNA相似性网络及已知miRNA-疾病关联计算miRNA空间预测得分,基于疾病相似性网络及已知miRNA-疾病关联计算疾病空间预测得分。最后,整合miRNA空间和疾病空间的预测得分预测潜在的miRNA-疾病关联。FCMDAP也能对孤立疾病相关的miRNA及孤立miRNA相关的疾病作出预测。
其他文献
爆发呼吸系统疾病是牛场新进牛主要疾病之一,表现为咳嗽、气喘、呼吸困难和深长喉音,牛生长受阻,严重影响肉牛养殖效益。针对目前各个养殖场出现的疾病问题,特进行了该病情况
电视数据新闻以其可视化、精确性、趣味性等特点迅速成为电视新闻家族中的后起之秀。随着数字技术的不断进步,电视数据新闻日益体现出更加独特的深度思维、人文关怀、有机关
水雷战和反水雷很大程度上受到海洋环境因素的影响,其中包括水深、海水特征、天气状况、海滩特征、潮汐与洋流、海洋生物,以及海洋磁状况等。文章探讨了对水雷战和反水雷影响
在家庭农场的已有文献中,"美国模式"、"欧洲模式"和"东亚模式"被提及最多,鲜有文献介绍拉美和非洲的家庭农场。本文在总结美国、欧洲和东亚三种家庭农场模式的基础上,对拉美
儿童健康与营养问题:肥胖和高血胆固醇了解营养与儿童健康两者之间的关系,对于以预防疾病和增进健康为目的的公共卫生是非常重要的。本文回顾了美国儿童和青少年中肥胖与高血胆
随着我国体育事业的蓬勃发展,体育用品企业数量直线增多,全民健身计划的实施、体育场地、器械的普及令群众体育得到前所未有的发展机遇。赛事运动是体育产业发展的“良药”,
在高中美术鉴赏教学中,笔者发现,有部分学生不会鉴赏美术作品,特别是对一些抽象美术作品,很多学生表示难以理解。那么,美术教师该如何引导学生鉴赏抽象美术作品呢?
硅通孔技术是实现芯片在三维方向堆叠的技术,此技术具有提高芯片在平面上的集成密度、减小外形尺寸、降低互联延迟和实现低功耗等诸多优点,成为延续“摩尔定律”的芯片制造关
<正>"门前三包"责任制是社会单位参与城市环境管理、培养全社会环境意识的重要形式,长期以来在城市建设中发挥了极为重要的作用。密云县地处北京东北部燕山脚下,是北京建设中
<正>农产品保鲜的特质增加了物流和储存的难度,将田地里的农产品送到消费者手中的农产品管理体系有待完善,消费者对农产品的信任和放心购买有待提高以中央在武陵山片区开展区