基于相似度计算与卷积神经网络的疾病相关联miRNA预测研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:wfdzdb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MicroRNA(miRNA)是由20~24个核苷酸构成的一类微小内源性单链的非编码RNAs。目前的许多研究表明,miRNAs和众多人类疾病关联密切。同时,miRNAs也和表型存在很强的联系。在此基础上,考虑利用miRNA作为生物标志物来标记不同人类疾病的可能性,以及利用miRNA和人类疾病的关联关系帮助研究人员深入理解疾病病因的分子机制,进而对相关疾病的药物开发和防治做出重要的贡献。因此,利用生物信息学探明每种miRNA和每种人类疾病之间的关联关系成为当下的一个研究热点。基于相似度计算的计算预测方法主要可以分为两类:一类是基于已知关联关系构建网络的方法,需求高性能的生物网络;另一类则是基于机器学习的方法,需求负样本集。本文使用相似度计算方法整合多源生物数据构建高质量的相似度数据,并结合卷积神经网络,探明未知的miRNA-疾病关联关系,由此提出两种计算模型。其一,基于正样本学习的miRNA与疾病关联关系预测方法。利用正样本提取miRNA和疾病在共享低维度空间中映射的隐特征,通过映射后的miRNA和疾病各自的潜在特征向量为每个miRNA-疾病关系对构造特征表达。最后利用卷积神经网络完成关系对的学习和预测。其二,考虑到基因在miRNA-疾病相互作用中起到的关键桥梁作用,将基因-疾病关联关系、靶基因-miRNA以及基因间的相互作用网络加入miRNA-疾病网络的构建中,得到疾病-基因-miRNA的三层网络。通过挖掘网络的拓扑结构信息和节点间的潜在信息来得到miRNA-疾病关系对的特征表达。在5-折交叉验证实验中,两种方法在miRNA-疾病关联数据集上取得的AUC分别为90.30%、90.43%,均高于其他先进算法。在肺肿瘤、心脏衰竭案例中,预测的top-50候选miRNA大部分可以在数据库和文献中得到验证。同时,两种方案不仅应用于预测miRNA-疾病关联关系,而且也能完成miRNA-表型关联关系预测任务。
其他文献
随着如今更多的老井区的再次开发,加密井,以及深水钻井,大位移井等多种新井型的应用,轨迹的精度问题再次引起研究人员的关注,通常所用的轨迹不确定性模型在对这些情况上的应
在控制领域中,具有优良性能的传感器对提高控制精度与控制质量有重要作用。针对煤矿工业,则需要快速准确地检测出甲烷含量。本文采用了实验与仿真相结合的方法,研究了电离式
大脑是人类全身最特殊的器官,其复杂的运行机制离不开神经系统和基因等物质共同作用。影像遗传学是一门将神经影像学和遗传学相结合的新兴交叉学科,使得研究人员可以从宏观和
随着工业自动化的普及以及智能化需求的不断提升,对工业机械臂的性能要求也愈来愈严格。机械臂的工作效率、负载能力以及工作空间这三方面的性能亟待提升。机械臂的轨迹优化
作为普通高中数学课程标准(实验)要求的七种基本能力之一,数据处理能力在学生数学素养的发展中起着重要作用.但笔者在教学过程中发现,高中生的数据处理能力还存在着一些问题.
随着社会科技进步,光催化技术在有机污染物降解、废水处理等方面越来越发挥着巨大的作用。因而,合成低成本、稳定性好且催化效率高的光催化纳米材料成为现阶段科学工作者聚焦
随着互联网的迅猛发展,网络上产生了大量Web评论,这也给自然语言处理带来了新的机遇和挑战。深入挖掘蕴含在海量文本评论信息中的情感倾向潜藏了巨大的商业价值和社会价值。
模糊相似度是通过局部信息刻画模糊集相似程度的度量,它在模糊系统与模糊控制器的设计中发挥着重要作用.模糊系统的本质是从输入论域到输出论域的一个映射关系,其特点是它可
“真实语境”是习得语言的优势,而对于海外汉语学习者而言,他们往往是在没有视觉信息输入的情况下进行语言习得的,这样的习得方式使学生很难在大脑中构建出语言内容的具体的
数字视频中人体行为的分类与辨识,是计算机视觉领域一个新的极具挑战性的研究方向,自兴起以来,传统的基于运动目标特征提取、运动模板分析等技术的研究,在实际应用中大多都会