论文部分内容阅读
Markov网是类似于Bayesian网的另一种进行不确定性推理的有力工具。它是用一个无向图来表示变量之间的依赖关系。图中的每一个结点表示问题域中的一个变量,两个结点不相邻表示两个变量独立,反之两个相邻结点表示两个变量之间存在着某种依赖。Markov网是一个无向图,构造一个Markov网不需要发现边的方向,所以要比构造一个Bayesian网容易得多。
遗传算法(GA)是一种模拟生物界自然选择和自然遗传机制的随机化搜索算法,由美国霍兰教授提出,其主要特点是群体搜索策略和群体中个体之间的信息交换,搜索不依赖于梯度信息。在实现机制上,它又是一种离散动力学系统,在给定初始群体和遗传操作的前提下,通过迭代实现群体的进化。
首先,本文提出了一个基于信息熵方法构造的Markov网,给出了一个有效的基于信息独立测试的Markov网的构造算法。该算法是一个基于依赖分析的算法,仅需O(n2)次CI(条件独立)测试,在测试样本中的条件独立时,利用了信息论中验证信息独立的一个重要结论,从而大大提高了算法效率。
其次,本文设计了两个由Markov网构造与其等价的Bayesian网的算法。(1):基于Markov网中结点依赖关系,设计了一个计算结点之间相互依赖度的打分函数,以确定结点之间边的方向,从而得到与Markov网等价的Bayesian网。算法的复杂度为O(e)次的依赖度计算,其中e为Markov网的边数。(2):基于遗传算法的优良特性,设计了一个遗传算法,对所有可能与Markov网等价的Bayesian网结构进行搜索,查找出某个Bayesian网结构S,S所有边的依赖度之和为最大。由于事先已经确定了Markov网的结构,所以遗传算法的搜索空间已大为缩小,从而使得该算法的效率大为提高。