论文部分内容阅读
图模型是图论、概率论,统计学等的交叉领域。图模型利用图这一比较直观的工具能够清晰地表示问题的背景知识及变量间的结构关系,是处理高维问题的有力工具。它广泛的应用于生物信息学、机器学习、决策论等各个领域。
近些年来,许多学者都利用图模型处理涉及成千上万个变量的高维、复杂问题。处理这些问题的十分有效的工具之一是图分解。利用图分解可以将这些高维问题化简为类似的含有较少变量的低维问题,进而提高解决问题的功效。例如,对图模型的估计、检验等统计推断都可分解为其素块上的边缘模型上进行推断。
本文基于图分解对图模型做了进一步研究,包括以下四个方面的工作。第一,基于MCS—M算法改进了Leimer的图分解算法,无论理论复杂度分析还是模拟实验结果都显示新的图分解算法比Leimer的图分解算法要略快一些,并且能快速的分解至少含有上万个顶点的图模型。第二,基于图分解改进了概率图模型的概率传播算法,提高了概率推断的效率。我们把概率传播算法中至关重要的步骤,即求最优三角化图问题(NP-hard),分解成各个小的子图上的最优三角化图问题,这样使问题的难度得到大大的降低。进一步给出了基于分解的构建团树的算法。我们的模拟结果显示,分解不仅可大大提高寻找最优三角化图和建立团树的速度,还可得到更高质量的三角化图。第三,考虑求高斯图模型极大似然估计,我们利用概率传播算法共享计算的思想,给出了改进的迭代比例拟合算法(IPSprocedure)和改进的HT算法,并给出了复杂度分析和模拟实验,两者均显示,我们的改进算法大大降低了传统的迭代比例拟合算法的复杂度,提高了运行速度。第四,我们考虑从道义图出发进行Bayes网结构学习.给出了道义图中道义边的更精细的刻画,指出道义边(α,β)相应的分离子是道义图中包含α,β的某素块中α或β的邻居集的完全子集,这样便可大大降低搜索分离子的范围,减少条件独立检验的次数。进一步提出了结构Structure-Finder(SF)算法基于图分解进行结构学习,并证明了SF算法的复杂度比Ic算法和Geng等人的方法小得多。同时,也与PC算法,TPDA算法,MMHC算法进行了比较,模拟结果显示,SF算法不仅运行速度快,而且得到的DAG的错误边数少。