论文部分内容阅读
作为新药研发的前期工作,从数目众多的小分子化合物中寻找具有某些生物活性或者药用功效的先导化合物是一项非常具有实际意义的工作。现有的天然小分子产物和合成化合物已经可以用千万计,随着近年来化合物合成的发展,越来越多的化合物被合成了出来,传统的高通量筛选已经无法满足新药开发的需要。基于这种情况,迫切需要新的计算机预测方法来扩充类药化合物的数量,虚拟筛选可能是今后解决此类问题的重要方法之一。虚拟筛选是指在计算机上利用软件,从化合物库中筛选可能与药靶结合或具有潜在生物活性的化合物。基于最大公共子结构(Maximum Common Substructure, MCS)的算法是目前一种非常有前途的药物虚拟筛选方法。最大公共子结构,顾名思义,就是指两个结构所共有的最大子结构。基于最大公共子结构的算法有很多优势。第一,结构相似的药物的最大公共子结构很有可能就是与它们活性相关的重要结构元件。第二,这种方法能够很直观的显示出两个化学结构间的公共部分。但是,寻找MCS是一个非常复杂的计算任务,运算时间会随着两个分子结构中原子数目的增加而呈指数级增长。所以,对于结构复杂的分子,计算MCS需要耗费很长的时间。在实际运用过程中,运算的速度和结果的精确度一直是一对矛盾,这也限制了其在虚拟筛选领域中的应用。本文对此方法计算时间进行了有效的评估,以世界卫生组织(WHO)基本药物和美国食品药品监督管理局(FDA)认证的小分子药物为样本,采用MCS算法进行结构相似性比对运算,通过设置不同的时间阈值,对计算结果进行统计分析,研究运算时间对计算结果的影响。最终我们发现,虽然运算时间和CPU的速度会对相似性得分产生影响,但是到达某一时间点后,延长运算时间对于结果的改善已经微乎其微。通过设置合理的时间阈值,可以提高该方法的运算效率。在统计分析的过程中我们考虑了不同机器运算能力的区别,所以此结果具有普遍实用性。在此基础上,本文还定量地研究了化合物结构的相似性和其生物活性之间的相关性,此研究可以帮助由相似性得分预估功能相似的概率,扩展了MCS-based算法在小分子功能预测领域的应用。随着大量的疾病相关靶点及其潜在治疗药物的发现,积累了大量的生物信息数据。这些药物、靶点的信息大多是分散的,数据内容参差不齐、文件格式缺乏统一的标准,往往存在不兼容的问题,并且它们之间的相互关系错综复杂,难以对其进行深入的数据挖掘。我们借助信息学的手段,建立了一个综合生物信息学和化学信息学的网络信息平台:M&Function。以互动、高效的数据库系统为基础,以功能强大先进、使用简便快捷的算法和软件为工具,对海量的电子资源和文献进行数据挖掘,致力于新药筛选和研究。所以,我们通过数据挖掘,整合小分子药物的名称、结构、功能、分类等信息,建立了一个小分子药物信息资源库。在此基础上,借助基于最大公共子结构和Fingerprint的结构比对软件,通过统计分析,建立了功能预测系统,对活性小分子进行生物学功能预测。M&Function平台丰富的数据信息、内嵌的图形显示和数据统计插件,以及人性化的网站设计,使M&Function平台直观、高效、简便易用,测试数据结果可靠。M&Function平台不仅是一个小分子药物信息资源库,也是一个小分子功能预测平台。可以为高通量先导化合物的筛选提供信息准备和数据支持。网站可以通过http://lifecenter.sgst.cn/mcs/home.do进行访问。