论文部分内容阅读
摘要:随着人类基因组计划和许多物种全基因组测序的完成,人类迎来了后基因组时代。在这一时代中,人们希望通过揭示基因及其产物蛋白质的功能,解决与人类健康和疾病相关的医学问题。研究表明在生物体内,细胞单元之间通过相互作用而发挥功能,这些相互作用形成了一个极其复杂的交互网络。疾病的表现型是复杂交互网络中各种生理和病理学过程的体现。基于网络的研究方法可以加深对细胞交互网、致病基因和疾病通路等的理解。相应地,人们可以研制出更好的药物以便更有效地治疗疾病。研究人员将网络理论在人类疾病、医学及其相关领域的应用研究称为网络医学。网络医学不仅为系统探究分子水平上疾病的复杂性提供了支持平台,还可帮助人们发现致病基因和筛选药物靶点。网络医学研究领域广泛。本论文期望采用计算分析的方法来对网络医学中三个亟待解决的关联问题进行研究,拓展对疾病的发病机理、病理过程和治疗方法等方面的了解。主要研究工作包括:(1)针对实验证实的(已标记的)药物-标靶关系较少、存在大量未知的(未标记的)药物-标靶关系,我们提出采用半监督学习算法来预测药物-标靶关系。我们从网络一致性的角度出发,融合多种生物特征,利用特征选择来预测药物-标靶相互作用关系,克服了有监督学习算法需要负样本辅助预测的不足。理论分析表明算法的时间复杂度得到了降低,交叉验证实验表明预测精度得到了提高。案例分析也得到了理想的预测结果。此外,我们还对未标记的关系进行了广泛的预测,部分预测结果在现有药物数据库中得到了证实。(2)虽然越来越多的研究表明与微RNA有关的变异、调控失常等均会引发各种疾病,但针对微RNA和OMIM疾病关联关系的研究较少,OMIM数据库中大多数的疾病未有与其相关联的微RNA信息。我们提出采用随机游走算法来预测微RNA-OMIM疾病关联关系。我们首先构建了OMIM疾病相似性网络和微RNA-OMIM疾病关联关系网络,然后将随机游走算法应用于OMIM疾病相似性网络中对候选疾病打分排序进行预测。实验表明该算法具有一定的预测精度。我们预测并验证了部分排序在前的微RNA-OMIM疾病关联关系。(3)随机游走算法用于微RNA-疾病关系预测时只用到了疾病相似性信息。为了进一步提高算法的预测精度,我们提出融合微RNA相似性信息、疾病相似性信息和微RNA-疾病二分图拓扑信息用于微RNA-疾病关系预测。我们充分研究了各相似性信息对算法预测精度的影响,实验结果表明融合多种相似性信息可以提高算法的预测精度。我们选择预测精度最好的算法NetCBI应用于微RNA-疾病关系预测。部分预测的排序在前的微RNA-疾病关联关系得到了相关数据库的证实。(4)单核苷酸多态(SNPs)可阐明不同人群和个体在疾病的易感性和抵抗性方面存在差异的原因。SNPs位点间存在连锁不平衡关系,因此不需要对所有的SNPs位点进行检测,可以根据连锁不平衡关系测定一部分SNPs(即标签SNPs)的信息,通过标签SNPs表征的信息覆盖其余SNPs。我们对现有的基于连锁不平衡的单种群标签SNPs选择算法进行广泛的比较。同时提出了一个改进的求解该问题的贪婪算法MinTag。实验结果表明算法MinTag较之前的算法能找到更少的标签SNPs,具有更高的节约率。实验还表明预先对数据集划分为不相关的子区域可以大幅度降低程序的运行时间。本文对网络医学中的上述三个关联问题进行研究,并提出了有效的求解算法。这些研究工作将会对生物学实验有指导意义。此外,本文提出的算法对其它类似的关联问题也具有普遍意义。