论文部分内容阅读
分子动力学模拟是一种在计算机上进行的虚拟物理实验。经典分子动力学模拟将分子中的原子视为质点,原子之间通过分子建模确定相互作用,原子的运动遵循牛顿运动定律。由于通过分子动力学模拟可以获得任意时刻任意原子的位置和速度,因此可以方便地测量某些实验中不易测量的物理量,有时具有传统物理实验所不具有的空间和时间解析度。当前分子动力学模拟已经广泛地应用于物理、化学、生物和材料等科学研究之中,并发挥了巨大的威力。另一方面,由于当前计算机能力的限制,分子动力学模拟研究问题的时间尺度和空间尺度都未能充分满足实际需求。因此,如何高效地进行分子动力学模拟已经成为一个非常重要的问题。
本文的主要工作是为分子动力学模拟开发高效算法,这里的“高效”包含了计算精确度高和计算速度快两个含义。精度高保证了模拟结果的正确性,速度快能充分利用现有计算资源,做更大规模、更长时间的模拟,以拓展研究视野。高质量分子动力学模拟要求在保证精度的前提下做到计算速度尽可能快,这就须要引入数学手段分别对精度和速度这两个方面进行定量分析。本文从非成键相互作用的高效计算、粗粒化方法和软件实现三个方面考察了分子动力学模拟的精度和速度。
本文首次对短程非成键相互作用的双截断半径方法和长程非成键相互作用的光滑粒子网格Ewald方法进行了先验误差估计。基于先验误差估计和计算开销估计,本文为这些方法设计了参数优化策略。参数优化策略通过自动选取参数,能够在保证精度的前提下,使非成键相互作用的计算速度达到近似最优。这项工作能有效地改善参数凭借经验选取,缺乏理论指导的现状。其中光滑粒子网格Ewald方法的先验误差估计已经被著名分子动力学模拟软件Gromacs4.5收录。
在粗粒化方法方面,本文以水为例,首次系统地考察了基于结构信息的粗粒化模型的优势和局限,并根据不足提出相应的改进策略。水的粗粒化模型能很好地重现全原子模型的径向分布函数及其对应的性质,比如等温压缩率,但是不能正确重现压强。引入压强修正后的粗粒化模型能正确重现压强,但是会破坏等温压缩率。粗粒化模型能在一定程度上重现正四面体组装。通过组合势能方法虽然能较正确地重现正四面体组装,但是不能重现径向分布函数。因此,应该根据实际需要选取正确的粗粒化策略。实际计算表明,水的粗粒化模型相对全原子模型的加速比能够达到约50倍。
在软件实现方面,本文在CUDA通用计算平台上开发了基于图形处理器(GPU)加速的分子动力学模拟软件GASSER(GPU Accelerated Simulator for Soft mattER)。通过分子信息操作层和分子拓扑操作层的分离,GASSER做到了计算速度和通用性、灵活性、易用性的很好的平衡,在可比情况下,其速度可以达到传统串行CPU模拟的30倍以上。本文的大多数分子动力学模拟是通过这个软件完成的。
本文将分子动力学模拟的高效算法和软件应用于两个实际问题:Lennard-Jones体系的三级相变研究和生物膜的自发曲率计算。通过分子动力学模拟计算三条等温线上Gibbs自由能的不同二阶偏导数,证明这些二阶偏导数不存在尖端型奇异点,因此体系在Andrews临界点之后的特定区域内(T*≥1.36)不存在三级相变。在生物膜的自发曲率计算上,首次为分子动力学模拟计算自发曲率提供了一套严格的数学理论。通过粗粒化分子动力学模拟,计算了由于脂类分子形状的非对称性引发的自发曲率,和理论结果的比较证实了本文方法的正确性。本文还研究了由于蛋白质附着引起的自发曲率。在蛋白质密度较低时,自发曲率随蛋白质数密度增加成线性增长。在蛋白质密度较高时,增长出现非线性性。
总的来说,虽然分子动力学模拟已经广泛地应用于科学研究,但是对其中的计算精度和速度问题尚缺乏系统的数学研究。本文虽然在这方面做了一些粗浅的尝试,但尚有许多困难的问题没有解决。希望本文的工作起到抛砖引玉的作用,为分子动力学模拟的算法研究引入精确的数学分析手段,以获得更高的效率。