论文部分内容阅读
化合物毒性是导致药物研发失败的主要原因之一。将药物安全性评价提前到药物研发早期阶段有助于缩短药物研发周期,降低开发成本。除了药物之外,食品添加剂、化妆品等与生活相关的其他化学品的安全性评估也是十分必要的。常规的毒理学试验方法需要耗费大量的时间和金钱,难以满足现代药物研发以及环境化合物风险评估的要求。研究者迫切需要依据“3R”原则开发替代方法,即减少(Reduce)实验动物数量、优化(Refine)实验程序、替代(Replace)实验动物。使用计算机方法进行化合物毒性预测,可以用较低的成本实现对大批量化合物进行快速的安全性评价。计算机方法的另一个优势是对药物发现早期阶段的虚拟化合物,也可以进行毒性预测。因此,计算毒理学方法已经成为化合物安全性评价中不可或缺的工具。本论文的研究工作主要包括两大部分:第一部分是化合物毒性预测模型构建,在这一部分工作中,分别构建了化合物急性毒性和致癌毒性的预测模型,第二部分是烟草与烟气化学成分毒副作用研究,在这里构建了烟草与烟气中的化学成分数据库,并对其进行了毒副作用预测研究,另外,使用系统评价方法分析了吸烟对于帕金森症患病风险的影响。论文的第一章,首先介绍了化合物毒性预测研究的相关背景和意义,以及目前计算机预测化合物毒性的主要方法和技术,包括交叉参照、定量/定性构-毒关系、警示子结构等。然后,介绍了国内外有关烟草与烟气及其有害成分的研究进展。接下来,介绍了帕金森症以及吸烟对帕金森症发病率的研究背景和系统评价研究进展状况。另外,也对用于系统评价的(?)neta分析(Meta-analysis)方法进行了介绍。化合物的急性毒性是在药物研发以及生态风险评估过程中必须要考虑的一个重要毒性性质。动物实验方法测定化合物的急性毒性需要大量的时间和资金投入,计算机预测是一种很重要的替代方法。论文第二章中,我们收集整理了12204种化合物的结构及其大鼠口服急性毒性实验数据。按照US EPA的毒性分级标准,将所有化合物划分为剧毒、高毒、中毒和微毒四个等级。然后,使用MACCS与FP4两种分子指纹表征分子结构,结合支持向量机、κ-最近邻居法、C4.5决策树、随机森林和朴素贝叶斯等五种机器学习方法分别构建了多分类模型。其中,支持向量机本身是一个两类问题的判别方法,我们采用“一对一”与“二叉树”两种策略用于多分类问题的解决。采用两个分别包含1678和375个化合物的外部验证集对构建的多分类模型进行了验证。模型MACCS-SVMOAo表现出了最强的预测能力,对两个外部验证集的总体预测准确率分别达到83.0%和89.9%。另外,我们采用信息增益技术和子结构频率分析方法,筛选了可能导致化合物产生急性毒性的优势子结构片段。致癌性是另一种受到广泛关注的化合物毒性性质。论文第三章,我们提取了CPDB数据库中829种化合物的大鼠致癌性实验数据,使用五种机器学习方法结合六种分子指纹类型,建立了用于预测化合物致癌毒性的二分类和三分类预测模型。使用测试集对模型进行初步验证后,分别选取了8个表现最好的二分类模型和7个表现最好的三分类模型,使用外部验证集进行进一步验证。外部验证集由ISSCAN数据库中的87种化合物构成。预测能力最强的二分类模型MACCS-kNN整体预测准确率达到83.91%,预测能力最强的三分类模型MACCS-kNN整体预测准确率也达到80.46%。我们筛选了五种在致癌化合物中出现频率明显高于非致癌物的结构片段,为化合物的致癌性研究提供警示作用。烟草烟气是严重危害人体健康的的成分十分复杂的混合物质。对烟草与烟气中的化学成分进行汇总和分析,有助于香烟风险评估研究以及监管香烟生产过程中有害成分的检测。论文第四章,我们构建了一个烟草与烟气化学成分数据库(The Chemical Components of Tobacco and Tobacco Smoke, CCTTS)。 CCTTS提供了烟草与烟气中5983种化学成分的化学结构、基本物理化学性质、毒性信息以及使用admetSAR工具预测得到的ADMET(吸收,分配,代谢,排泄和毒性)性质。在这些化学成分中,568种已有明确的实验毒性数据,另有145种化学成分被预测为具有急性毒性或者致癌性。本数据库将可通过互联网进行浏览和检索。吸烟有害人体健康,不过许多流行病学研究表明吸烟有可能会降低患帕金森症的风险。论文的第五章,我们通过meta分析方法系统评价了现有的吸烟与帕金森症风险的研究结果。我们全面地检索了1960年到2014年10月期间有关吸烟与帕金森症风险相关性研究的英文文献,从中筛选了61项回顾性的病例对照研究和9项前瞻性的队列研究。与不吸烟者相比,吸烟者患帕金森症的相对风险值RR(95%置信区间)的合并值为0.59(95%置信区间,0.56-0.62),表示曾经吸烟者患帕金森症的风险比不吸烟者低41%。我们进一步按照不同的流行病学研究方法、受试者性别、对照组来源、吸烟量以及研究年代等进行了亚组分析。各个亚组的meta分析,都表现出了吸烟在帕金森症方面的保护作用,这种保护性作用十分明显,并且吸烟量越大,这种保护作用越强。我们总结了目前有关这种保护作用生物机制的一些假说,建议研究者们深入了解这一保护作用的生物机制,进而有助于从烟草和烟气成分中发现潜在的延缓和治疗帕金森症的药物。论文的第六章对全文的研究工作进行了总结,并突出了论文的创新点。