基于数据融合的复杂疾病关联网络预测算法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:jimgreen22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,微RNA(microRNA,miRNA)作为疾病的诊断生物标志物和治疗靶点,已被证实参与许多重要的生物学过程,并与各种人类复杂疾病密切相关。因此,开发有效的计算方法来识别潜在的疾病-miRNA关联将为疾病治疗提供新的视角。目前,使用小分子药物靶向疾病相关的miRNA可以治疗多种人类复杂疾病。同样,识别小分子相关的miRNA对于疾病治疗和药物的临床应用具有重要意义。此外,研究表明除了miRNA的失调可以引起疾病,微生物的失调也可以导致疾病。因此,预测疾病潜在关联的微生物有助于人们了解疾病的发病机制,并对于疾病的预防、诊断、监控、预后和治疗起到非常重要的作用。本文旨在基于多种生物数据构造异构网络,建立预测模型预测潜在的疾病-miRNA关联、小分子-miRNA关联和疾病-微生物关联。本文主要研究内容如下:(1)提出基于三层异构网络的疾病-miRNA关联预测模型TLHNMDA。我们通过整合已知的疾病-miRNA关联、已知的长链非编码RNA(long noncoding RNA,lncRNA)-miRNA相互作用、疾病相似性、miRNA相似性和lncRNA相似性构建三层异构网络,提出基于全局网络的迭代更新算法预测潜在的疾病-miRNA关联。在模型中,我们引入已知的lncRNA-miRNA相互作用和lncRNA高斯相互作用谱核相似性,将lncRNA作为连接疾病和miRNA的桥梁,构造出能够充分挖掘网络信息的迭代更新算法预测潜在的疾病-miRNA关联。与此同时,TLHNMDA也能预测出潜在的lncRNA-miRNA相互作用。交叉验证和案例研究的结果表明,TLHNMDA可以有效地预测潜在的疾病-miRNA关联。(2)提出基于矩阵分解和标签传播的疾病-miRNA关联预测模型MDLPMDA。我们首先使用稀疏学习方法(Sparse Learning Method,SLM)分解已知的疾病-miRNA关联矩阵得到一个新的疾病-miRNA关联矩阵。然后,分别在疾病相似性网络和miRNA相似性网络上融入已知的疾病-miRNA关联和新的疾病-miRNA关联。最后,运用标签传播算法(Label Propagation Algorithm,LPA)预测潜在的疾病-miRNA关联。在MDLPMDA中,SLM可以去除已知的疾病-miRNA关联矩阵中的噪声得到新的疾病-miRNA关联矩阵,可以提高预测模型的精度。此外,MDLPMDA分别基于疾病相似性网络和miRNA相似性网络预测潜在的疾病-miRNA关联分数,并通过整合两种关联分数得到最终的关联分数,使得预测结果更具有可信度。交叉验证和案例研究的结果表明,该模型具有较好的预测性能。此外,该模型还可以预测新疾病潜在关联的miRNA。(3)提出基于三层异构网络的小分子-miRNA关联预测模型TLHNSMMA。我们通过整合小分子相似性、miRNA相似性、疾病相似性、已知的小分子-miRNA关联和已知的疾病-miRNA关联构建三层异构网络,提出基于全局网络的迭代更新算法预测潜在的小分子-miRNA关联。在TLHNSMMA中,我们通过引入多源生物数据,以疾病为纽带,构建连接小分子和miRNA的迭代更新算法,充分挖掘三层异构网络的拓扑信息,从而预测潜在的小分子-miRNA关联。交叉验证和案例研究的结果表明,TLHNSMMA具有可靠的预测性能。(4)提出基于HeteSim的小分子-miRNA关联预测模型HSSMMA。我们首先结合已知的小分子-miRNA关联、miRNA相似性和小分子相似性构建两层异构网络。然后,通过考虑小分子至miRNA长度小于4的所有搜索路径,运用HeteSim度量方法基于每条路径计算潜在的小分子-miRNA关联分数。最后,通过平均集成所有路径上的关联分数得到最终的小分子-miRNA关联分数。在HSSMMA中,我们不仅整合多源生物数据构建异构网络,而且构造长度合适的路径,引入度量方法HeteSim充分挖掘小分子至miRNA的路径信息。交叉验证和案例研究的结果证明,HSSMMA可以作为识别潜在的小分子-miRNA关联的有用工具。此外,该模型可以预测新小分子潜在关联的miRNA。(5)提出基于矩阵分解和标签传播的疾病-微生物关联预测模型MDLPHMDA。基于已知的疾病-微生物关联、疾病相似性和微生物相似性,我们首先利用SLM分解已知的疾病-微生物关联矩阵获得新的疾病-微生物关联矩阵。然后,基于已知的疾病-微生物关联和新的疾病-微生物关联,分别从疾病和微生物的角度利用LPA预测潜在的疾病-微生物关联。最后,通过整合两种预测出的关联分数得到最终的疾病-微生物关联分数。在模型中,SLM可以将已知的疾病-微生物关联矩阵分解成包含其真实信息结构的低秩矩阵的线性组合与包含噪声的稀疏矩阵,基于低秩矩阵获得的新的疾病-微生物关联矩阵可以有效地提高模型的预测精度。此外,LPA分别从疾病和微生物两种角度预测潜在的疾病-微生物关联,增加了预测结果的可信度。交叉验证和案例研究的结果显示,MDLPHMDA可以有效地预测潜在的疾病-微生物关联。该论文有图24幅,表21个,参考文献255篇。
其他文献
雄安新区建设中新能源行业缺乏科学规划,科技研发核心技术亟待突破。应当通过科学规划将雄安新区建设成为高度电气化的近零碳示范城市,完善新能源行业空间布局,鼓励新能源行
液压节流阀作为液压传动与控制中非常重要的基础性元件,具有密封性好,抗污染能力强等特点,被广泛的应用在液压系统中。但当节流阀内发生空化时,空化的周期性溃灭使阀内压力产
<正>新能源汽车的蓬勃发展,以及政策和市场的推动,使我国成为全球最主要的锂离子电池生产和消费国。大量锂离子电池进入市场,废旧锂离子电池回收和再利用问题也成为行业重大
著者回顾了我国50年来报道的587例心脏粘液瘤的发病情况,并结合文献进行了简要的讨论。
本文综合考虑了实际生产中影响塑件尺寸的各种主要因素,分析了现行的注塑模模腔尺寸计算公式的不足之处,并分别用极限法和概率法推出了塑件尺寸公差与塑件尺寸,塑料收缩率的波动
癌症是当前全世界引起死亡的主要疾病之一,严重威胁人类健康。小分子抗癌药物是治疗癌症的重要手段,但仍有很大一部分肿瘤缺乏有效的治疗手段。同时,现有小分子药物的长期使
在生活日益便捷、科技不断进步发展的今天,互联网已经悄无声息的渗透进我们生活的方方面面。为了能够在日益激烈的市场竞争环境中谋求自身持续稳定以及更好的发展,许多互联网
本文通过对2.260M与4.280M两处高原居民血中HbC0浓度的测定证明吸烟使高原居民血中HbCO浓度的测定证明吸烟使高原居民PaO2和HbO2%有较明显下降,继发性红细胞增多症的发生率明
期刊
一句话导读对刑罚变更执行监督的“参与型”同步监督改革仍然属于游离于诉讼程序结构之外的“局外”性质的“旁观者式”监督,可以借鉴“公诉模式”的诉讼三角形结构原理,在刑
本文介绍了注塑模中任意柱形冷却水道的几何生成及模型存储方式,详细论述了任意柱形冷却水道的冷却模拟数值分析方法。介绍了这种冷却系统的设计及分析实例。