论文部分内容阅读
本文主要研究基于生物网络的关联发现技术,司用于解决在以“老药新用”为指导思想的药物研发过程中“如何确定目标疾病的候选药物”这一关键问题。该问题即等同于对候选药物的前瞻性预测问题,可具体分解为三个子问题:①预测目标疾病的致病基因;②关联新的药物一靶标交互作用;③推理预测疾病一药物关联关系。为了验证本文所提理论及方案的可行性,开发了一套原型系统,进行了工程实践验证。主要研宄内容包括以下几个方面:
(1)本体知识库的构建
针对“老药新用”为指导思想的药物研发过程中“如何确定目标疾病的候选药物”这一关键问题,结合本体的相关理论,构建了三类生物本体模型,分别是疾病本体、药物本体、蛋白质本体,并针对目前权威的6个开放生物医学数据库,给出了一个基于本体的数据集成框架,构建了对应的三类生物本体知识库,为后续的关联发现研究提供了统一且通用的数据基础和知识服务。
(2)预测目标疾病的致病基因
针对目标疾病的致病基因预测问题,根据网络拓扑特征分类预测和贝叶斯回归分析预测的方法特点,提出了一种联合的致病基因预测算法。以生物本体知识库为数据基础,构建疾病一基因网络和蛋白质交互网络,分析候选基因在PPI(蛋白质交互)网络中的拓扑特性,根据己知致病基因的拓扑特征训练分类器,再对候选基因进行分类,得到潜在致病基因的初步预测结果,再将此预测结果作为先验知识,带入后续的贝叶斯回归预测模型中,并引入贝叶斯因子的概念用于度量候选基因与目标疾病的关联性大小,依此关联指标最终确定目标疾病的潜在致病基因。
(3)关联新的药物-靶标交互作用
为解决新的药物-靶标交互作用预测问题,针对前人基于二分图建模的预测方法中存在的不足,提出了一种新的基于二分图评价模型的改进预测算法。该算法根据己知的药物-靶标交互作用构建二分图网络,分别从药物化学结构信息和药物疗效信息两个角度来综合刻画药物-靶标作用对的关联性评价模型,再依此模型预测新的药物-靶标蛋白质交互作用,即预测新靶标。
(4)推理预测出新的疾病-药物关联
为了推理预测出新的疾病-药物关联,针对(2)、(3)研究得出的预测结果(新的疾病-基因关联关系、药物-靶标关联关系),提出了一种融合推理算法,通过基因或蛋白质的传递,获取疾病-药物关联关系。该算法使用非相关推理准则,给出了具体的推理筛选步骤,来预测新的疾病-药物关联关系。
(5)开发原型系统
基于以上研究成果,开发了一套基于生物网络的关联发现应用系统,该系统以生物本体知识库为数据基础,能构建并形式化展示疾病一基因关联网络和药物一靶标关联网络,并在后台实现了本文所提的三种关联发现算法,可分别用于预测目标疾病的潜在致病基因、关联新的药物一靶标交互作用,以及推理预测新的疾病一药物关联,用于解决以“老药新用”为指导思想的药物研发过程中“如何确定目标疾病的候选药物”这一关键问题。