论文部分内容阅读
微RNA(microRNA,简称miRNA)虽然不能编码蛋白质,但可以调控基因表达,在人体多种生命活动中有重要功能。研究表明,miRNA与多种人类疾病的发生发展密切相关,并且miRNA是可行的小分子药物靶点。疾病及小分子药物相关的miRNA研究对于疾病发生发展机制的理解、疾病的诊断和药物的研发均具有重要意义。miRNA-疾病、小分子药物-miRNA关联预测模型可以识别出最有可能的潜在关联,对于生物实验有重要的指导作用。本文分别基于集成学习和个性化推荐方法构建模型预测疾病、小分子药物相关的miRNA,主要的研究内容如下:(1)提出了基于决策树集成的miRNA与疾病的关联预测模型(Ensemble of Decision Tree based MiRNA-Disease Association prediction,简称EDTMDA)。首先基于miRNA-疾病关联信息和整合的相似性信息分别构建miRNA的特征和疾病的特征。然后,通过随机选取负样本、miRNA特征和疾病特征,以及特征降维处理,构建了多个决策树。最后将这些决策树预测值的平均值作为miRNA-疾病关联分数。相比于单个学习器方法,集成学习有更高的预测精度,另外,把特征降维融入到集成学习中可以去除学习过程中的噪声及冗余信息,并降低模型的计算复杂度。(2)提出了基于贝叶斯排序的miRNA与疾病关联预测模型(Bayesian Ranking for MiRNA-Disease Association,简称BRMDA)。BRMDA模型是基于miRNA与疾病关联预测问题的特点,从三个方面改进贝叶斯个性化排序(BPR)算法得到的:1)增加miRNA相似性信息和疾病相似性信息;2)增加miRNA偏置项;3)采用基于邻居信息的方法预测新疾病或新miRNA的关联。BRMDA是基于个性化推荐方法的模型,可以为每种疾病生成最优的miRNA排序结果。(3)提出了基于核岭回归集成的小分子药物与miRNA的关联预测模型(Ensemble of Kernel Ridge Regression based Small Molecule drug-MiRNA Association prediction,简称EKRRSMMA)。首先,本文把整合的小分子药物相似性和miRNA相似性分别作为小分子药物的特征和miRNA的特征。然后基于特征的随机选取和特征降维,本文从小分子药物和miRNA的角度分别构建多个核岭回归学习器。最后将它们预测值的平均值作为小分子药物-miRNA关联得分。对于提出的miRNA-疾病关联、小分子药物-miRNA关联预测模型,本文通过多种交叉验证方式及案例研究评估其预测性能。结果显示,这些模型的性能表现均十分可靠。