论文部分内容阅读
计算问题是Bayes统计学发展和得以普及应用的命脉,而MCMC技术是解决这一问题的利器,对MCMC及其相关算法的研究有助于Bayes方法在实践中更为广泛的应用。 目前虽然在Bayes理论框架下国外学者对MCMC已有大量研究并提出了诸多算法,但实际上真正易于在计算机上实现的方法并不多,因此本课题致力于MCMC方法的具体实现的研究,这一实现体现在计算的自动化方面。在对MCMC方法的基本理论及其算法研究的基础上,本研究运用计算机随机模拟的原理和方法,采用面向对象的编程技术,对如何编程实现MCMC算法以及如何将其应用到统计学模型上进行了理论和实践探索。 通过理论研究及实践总结,对如何实现Gibbs抽样算法的基本思路归纳如下:首先根据实际问题确定统计学模型并选取各个参数的先验分布,然后依据模型构建出DAG图模型中各个节点(参数)之间的父子关系,在此关系上构造各待估参数的完全条件分布,最后应用适应性舍选抽样算法(ARS)对各参数进行随机抽样,循环此抽样过程直到取得了足够多的样本用于估计。依 第四军医大学硕士学位论文据此实现思路,用Delphi编制出了一系列对象及函数,初步实现了Gibbs抽样算法,构建了一个便于持续开发的软件环境并将计算软件暂命名为ARSP。在此软件环境下,后来的开发者仅需书写定义变量和为变量进行赋值的代码语句即可实现对一个新的统计模型的计算,依据随机变量的父子关系,系统能够自动计算其完全条件分布,在此过程中开发者完全不用考虑此计算的任何实现细节。要进一步扩展开发环境,开发者只需定义新的分布类型,具体要做的就是定义此分布的参数及密度函数的计算公式。目前在开发环境中己定义了均匀分布、二项分布、泊松分布、正态分布、伽玛分布、贝塔分布、t分布和帕莱托分布:计算结果包括描述性统计量:均数、中位数、标准差、四分位数、95%Cl、峰度系数、偏度系数:统计图有直方图(用于描述参数的后验分布)和踪迹图(用于参数模拟收敛性的诊断)。要对模拟的Markov链进行更深入的分析,用户可将中间结果以多种文件格式导出到外部文件,这些文件可以被多数统计软件读取。此外,本系统较WinBUGS提供了更为丰富的数据接口,包括dBASE、Paradox、MSAeeess、MS Exeel和TXT格式的数据,这使得数据采集范围更加广泛,对数据的输入编辑以及核查校验更为方便。本软件采用Windows风格界面,支持鼠标操作,通过菜单、按钮、文本框等与用户交互,目前已形成基本的界面框架。 在此环境下,ARSP可完成对下列统计问题的建模和模拟计算:描述性统计量、一元及多元线性回归、有随机效应的Logisti。 第四军医大学硕士学位论文回归、方差分量模型、正态分层模型、交叉设计的生物等效性检验、Poisson模型、Meta分析等,绝大部分结果可与WinBUGS软件的计算结果相互验证。目前,ARSP的限制在于只适应于广义线型模型的计算,不足之处是计算效率较WinBUGS低,计算结果尚存在一些偏差,软件的用户界面也还有待进一步完善。 文中还探讨了一些应用MCMC和提高MCMC算法性能的问题,如迭代次数、收敛性诊断以及重新参数化等。 总之,通过本研究初步总结出了编程实现MCMC方法的思路,该思想经过实践验证总体上是可行的且易于在计算机上实现。据此开发的软件ARSP运行基本稳定,程序易于扩展,具备良好的可持续开发的特性。