论文部分内容阅读
Monte Carlo计算方法是一种重要的随机建模方法,在统计物理、生物物理、材料科学及工程学等多领域存在广泛应用。Monte Carlo方法的有效性建立在模拟中的抽样过程之上。Monte Carlo方法可以构建各种(抽样)目标概率分布,而重要性抽样技术规范了概率分布构建方式,有利于缩减样本的统计方差。基于马尔科夫链的MonteCarlo(MCMC:Markov Chain Monte Carlo)方法是一种常用的重要性抽样实现方式,在分子模拟和统计物理等领域是一种重要的建模手段;然而MCMC建模中马尔科夫链的平衡演化需要满足各种条件,典型的有如各态历经(ergodicity)条件,而复杂系统概率分布的局部极小或者统计系统中亚稳态的存在,会使得这些条件在有限时间内不能或难以满足,从而导致MCMC抽样的效率低下甚至统计错误,这成为Monte Carlo增强抽样研究的重要课题之一。广义上,Monte Carlo增强抽样是指从Monte Carlo方法的理论与应用中发展新的方法手段,来增强模拟中抽样样本的有效性,以增加样本统计结果的精确度,提高Monte Carlo建模的速度。另一方面随着计算机的可用性(availability)提高,出现了大规模Monte Carlo计算的需求,如现代分子模拟中的药物设计和蛋白质高分子模拟应用,人们需求MonteCarlo方法在计算机实施上更方便有效,包括对Monte Carlo网络并行计算的需求,因而Monte Carlo并行抽样和相关软件系统设计的研究存在潜在的重要意义。本文主要围绕Monte Carlo增强抽样理论和方法而展开研究,并完成了以下主要工作内容和创新点:1)对Monte Carlo计算模拟中的关键问题进行了剖析,提出用广义正则系综分布来克服模拟中局部极小问题或亚稳态的影响,以提高Monte Carlo抽样的有效性。对Monte Carlo计算模拟中关键问题的理解是Monte Carlo增强抽样研究的基础。Monte Carlo计算模拟和系统概率分布密切相关。在统计物理微观态分布上,广义正则系综分布是传统正则系综分布的一般化。使用广义正则系综的Monte Carlo模拟时,通过调节广义正则分布的自由参数,可以控制模拟的抽样分布,有利于克服亚稳态的影响以增加抽样的有效性,同时也有利于减少弛豫时间和隧穿时间加快模拟进度。2)提出了广义正则系综的Wolff算法,并应用于二维大尺寸Potts模型中,加深了对其相变构象形态的认识。在MCMC模拟格点(lattice)系统中,常用的Metropolis-Hastings单自旋体翻转的随机行走方式缺乏动力学上的活性,而Wolff算法采用聚簇翻转方式,大大增强了Monte Carlo模拟的动力性。为了结合广义正则系综的优势,本文研究并实现了广义正则系综下的Wolff算法,该方法具有可控分布和动力性强的双重优势,增加Monte Carlo模拟的探测能力。应用在大尺寸Potts模型中得出了其特殊相变规律,增加了对其一阶相变的理解。3)通过推导获得平坦直方图分布的充分必要条件,提出了一种用于估计态密度的线性预测直方图方法,降低了一般平坦系综方法构建平坦分布所需随机步的量级。对平坦直方图系综这一类方法进行了归纳研究,理论上推导了如何实现平坦抽样分布和稳定正态分布的条件,并基于此提出了一个快速估计态密度的方法,该方法根据已有的能量分布自适应地预测熵的导数函数,构建平坦能量分布所需随机步量级可由一般常见的O(N2)降为O(N3/2)~O(N1/2)。4)探究了Monte Carlo分布式并行抽样中样本容错和迭代更新统计等关键技术;在理论和实验上证明了广义正则系综下的并行回火模拟具有稳定副本(replica)间交换接受率的作用。首先对Monte Carlo并行计算方式进行建模,基于样本统计的分析之上,探究了Monte Carlo分布式并行抽样中样本容错和迭代更新统计等关键技术。研究了广义正则系综的并行回火模拟的特点,认证了其具有稳定副本间的交换率的作用,使得Monte Carlo模拟回火过程效率更高。5)设计了一个基于类库核心的Monte Carlo软件系统,不仅能够实施本文提出和研究的算法应用,而且还具有很强的可复用性和可扩展性。本文设计并实现了一套Monte Carlo软件系统,它充分考虑Monte Carlo科学计算的特点,支持多语言编程实现,达到了类库级乃至构件级复用;而且对样本抽样和统计分析两阶段都可以方便实施,为Monte Carlo软件计算探索出了一个可行有效的解决方案。本系统采用基于类库核心的设计,同时也提出了在CCA框架下的构件设计,增强了其支持Monte Carlo分布式计算应用的能力。该系统整体上实现了算法、物理模型和编程语言的独立性和可扩展性,为Monte Carlo方法的深入研究和应用提供了一个可行的软件计算平台系统。以上工作都是围绕Monte Carlo增强抽样理论和方法研究而展开,不仅涉及抽样理论而且也有计算机方面的理论实践,体现了对Monte Carlo增强抽样研究的深度和系统性。本文研究成果有助于人们利用Monte Carlo方法解决复杂多维计算问题。