论文部分内容阅读
近年来,微RNA(microRNA,miRNA)作为疾病的诊断生物标志物和治疗靶点,已被证实参与许多重要的生物学过程,并与各种人类复杂疾病密切相关。因此,开发有效的计算方法来识别潜在的疾病-miRNA关联将为疾病治疗提供新的视角。目前,使用小分子药物靶向疾病相关的miRNA可以治疗多种人类复杂疾病。同样,识别小分子相关的miRNA对于疾病治疗和药物的临床应用具有重要意义。此外,研究表明除了miRNA的失调可以引起疾病,微生物的失调也可以导致疾病。因此,预测疾病潜在关联的微生物有助于人们了解疾病的发病机制,并对于疾病的预防、诊断、监控、预后和治疗起到非常重要的作用。本文旨在基于多种生物数据构造异构网络,建立预测模型预测潜在的疾病-miRNA关联、小分子-miRNA关联和疾病-微生物关联。本文主要研究内容如下:(1)提出基于三层异构网络的疾病-miRNA关联预测模型TLHNMDA。我们通过整合已知的疾病-miRNA关联、已知的长链非编码RNA(long noncoding RNA,lncRNA)-miRNA相互作用、疾病相似性、miRNA相似性和lncRNA相似性构建三层异构网络,提出基于全局网络的迭代更新算法预测潜在的疾病-miRNA关联。在模型中,我们引入已知的lncRNA-miRNA相互作用和lncRNA高斯相互作用谱核相似性,将lncRNA作为连接疾病和miRNA的桥梁,构造出能够充分挖掘网络信息的迭代更新算法预测潜在的疾病-miRNA关联。与此同时,TLHNMDA也能预测出潜在的lncRNA-miRNA相互作用。交叉验证和案例研究的结果表明,TLHNMDA可以有效地预测潜在的疾病-miRNA关联。(2)提出基于矩阵分解和标签传播的疾病-miRNA关联预测模型MDLPMDA。我们首先使用稀疏学习方法(Sparse Learning Method,SLM)分解已知的疾病-miRNA关联矩阵得到一个新的疾病-miRNA关联矩阵。然后,分别在疾病相似性网络和miRNA相似性网络上融入已知的疾病-miRNA关联和新的疾病-miRNA关联。最后,运用标签传播算法(Label Propagation Algorithm,LPA)预测潜在的疾病-miRNA关联。在MDLPMDA中,SLM可以去除已知的疾病-miRNA关联矩阵中的噪声得到新的疾病-miRNA关联矩阵,可以提高预测模型的精度。此外,MDLPMDA分别基于疾病相似性网络和miRNA相似性网络预测潜在的疾病-miRNA关联分数,并通过整合两种关联分数得到最终的关联分数,使得预测结果更具有可信度。交叉验证和案例研究的结果表明,该模型具有较好的预测性能。此外,该模型还可以预测新疾病潜在关联的miRNA。(3)提出基于三层异构网络的小分子-miRNA关联预测模型TLHNSMMA。我们通过整合小分子相似性、miRNA相似性、疾病相似性、已知的小分子-miRNA关联和已知的疾病-miRNA关联构建三层异构网络,提出基于全局网络的迭代更新算法预测潜在的小分子-miRNA关联。在TLHNSMMA中,我们通过引入多源生物数据,以疾病为纽带,构建连接小分子和miRNA的迭代更新算法,充分挖掘三层异构网络的拓扑信息,从而预测潜在的小分子-miRNA关联。交叉验证和案例研究的结果表明,TLHNSMMA具有可靠的预测性能。(4)提出基于HeteSim的小分子-miRNA关联预测模型HSSMMA。我们首先结合已知的小分子-miRNA关联、miRNA相似性和小分子相似性构建两层异构网络。然后,通过考虑小分子至miRNA长度小于4的所有搜索路径,运用HeteSim度量方法基于每条路径计算潜在的小分子-miRNA关联分数。最后,通过平均集成所有路径上的关联分数得到最终的小分子-miRNA关联分数。在HSSMMA中,我们不仅整合多源生物数据构建异构网络,而且构造长度合适的路径,引入度量方法HeteSim充分挖掘小分子至miRNA的路径信息。交叉验证和案例研究的结果证明,HSSMMA可以作为识别潜在的小分子-miRNA关联的有用工具。此外,该模型可以预测新小分子潜在关联的miRNA。(5)提出基于矩阵分解和标签传播的疾病-微生物关联预测模型MDLPHMDA。基于已知的疾病-微生物关联、疾病相似性和微生物相似性,我们首先利用SLM分解已知的疾病-微生物关联矩阵获得新的疾病-微生物关联矩阵。然后,基于已知的疾病-微生物关联和新的疾病-微生物关联,分别从疾病和微生物的角度利用LPA预测潜在的疾病-微生物关联。最后,通过整合两种预测出的关联分数得到最终的疾病-微生物关联分数。在模型中,SLM可以将已知的疾病-微生物关联矩阵分解成包含其真实信息结构的低秩矩阵的线性组合与包含噪声的稀疏矩阵,基于低秩矩阵获得的新的疾病-微生物关联矩阵可以有效地提高模型的预测精度。此外,LPA分别从疾病和微生物两种角度预测潜在的疾病-微生物关联,增加了预测结果的可信度。交叉验证和案例研究的结果显示,MDLPHMDA可以有效地预测潜在的疾病-微生物关联。该论文有图24幅,表21个,参考文献255篇。