论文部分内容阅读
因果贝叶斯网络是研究不确定环境下因果推断的主要工具之一,也是机器学习、模式识别、数据分析及预测的重要方法.目前,大量学习因果贝叶斯网络结构的算法均满足因果充分性假设,即网络中不含有隐藏变量或者隐藏变量没有多于两个子节点.但是有时隐藏变量是实际存在的,因此放松因果充分性这一假设,学习含有隐藏变量的因果贝叶斯网络(简称隐网络)的结构具有重要的理论意义和应用价值.如何有效地分析数据提取可靠的信息进行因果推断是隐网络结构学习中的研究热点问题.本文着重研究隐网络的结构学习机制,主要工作有:首先,探讨了目前通过学习祖先关系来刻画隐网络中变量间因果关系的必要性.在不考虑因果充分性假设的前提下,对FCI算法、MBCS*算法和RFCI算法的主要学习步骤进行分析,指出了这三种算法的适用范围及其各自的优缺点.其次,基于因果推断给出一种新的两步法学习隐网络结构.第一步采用BSPC算法,利用观察数据学习隐网络的映射图,第二步在考虑实验总体花费的情况下,结合先验知识和最优实验设计提出新算法IPKOED,利用此算法确定更多未定向的边的方向,以便得到最佳的隐网络的代表图.最后,从理论上对算法BSPC进行证明,同时对ALARM和HAILFINDER网络进行仿真实验.实验结果说明此算法不仅可以减少噪音进而确保条件独立测试的可靠性,而且需要较少的测试次数,进一步降低学习网络结构的复杂度.同时,学习得到的网络结构含有较少的冗余边和定向错误的边.