论文部分内容阅读
药物不良反应(Adverse Drug Reaction,ADR)是现代医疗保健领域的一大挑战。其显著增加病人发病率和死亡率,不仅对医疗保健系统造成负担,也给药物的研发和药物的安全性带来了诸多挑战。虽然已有诸多研究从各个层面构建药物不良反应的预测模型,并取得了一定成效;但鲜有工作能建立药物化学分子的结构特征与其临床不良反应之间的关联。本课题围绕药物结构特征展开,从药物不良反应知识本体库ADReCS v2.0获取药物的清单,通过人工层层筛选,最终建立1,313个药物和4,670个药物不良反应的首选语词条的数据集。通过 Scaffold Network Generator、PaDEL-Descriptor和Open Babel等工具,我们将药物的结构特征以核心骨架(Scaffold)和分子指纹(Fingerprint)的形式呈现,并采用三种不同的方案分析这些结构特征。我们通过骨架网络分析了 1,219个药物及其对应的4,837个骨架。其中,超过五分之一的药物集中于22个核心骨架,尤其是苯环。关联分析结果表明,191个骨架至少与一个ADR有显著关联(q<0.01)。药物不良反应相似性的比较得出,即使药物核心骨架相同,药物所引起的ADR还是只有小部分相同。为了进一步确认药物结构片段是否更适合用于表征药物不良反应,我们基于PubChem Fingerprint的关联分析,从中找到12,095对显著关联对(q<0.01)。其中,408个分子指纹对多数药物不良反应来说是危险因子(OR>1),另外有174个是安全分子指纹(OR<1)。此外,利用信息论的方法,我们找出每个药物不良反应的最有可能的前50个毒效团(Toxicophore),随后基于支持向量机和随机森林算法,构建了粒性白血球缺乏症和药物滥用的预测模型。其中,随机森林算法在外部验证集的表现更佳,十重交叉验证和外部测试集评估的准确率都超过60%。最后,我们从生物活化的角度,试图分析了药物不良反应的发生机制。综上所述,药物结构不仅与药物的疗效相关,也影响着药物不良反应的发生。基于药物结构特征的分析,能进一步了解药物结构以怎样的形式参与药物不良反应的发生,为药物不良反应的发生机制提供帮助,也为构建更加普适、稳健的药物不良反应预测模型指明方向。