具有隐变量的贝叶斯网络结构学习研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:ypengw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
过去十多年里,大量的研究都集中在通过观察数据学习贝叶斯网络。在学习贝叶斯网络模型过程中有一个重要问题是,存在隐藏的或者潜在的变量。这些不可观察的变量却能够汇聚显变量之间复杂的依赖关系,简化网络结构,并对网络的学习、推理和预测等产生重要影响。因此,学习含有隐变量的贝叶斯网络模型成为该领域的一个重要研究内容;发现隐变量并确定其在网络中的位置是一个充满挑战性的问题,同时也具有重要的科学意义和较高的应用价值。论文中,将针对具有隐变量的贝叶斯网络结构学习展开一系列的探讨。具有隐变量的网络结构学习内容主要包括两个方面:一是,检测网络中含有的隐变量的个数;二是,确定具有隐变量的局部网络结构。针对这两个方面的研究内容,本文所开展的工作具体研究如下:第一,针对现有学习方法都难以准确确定网络中所含有隐变量个数的缺点,提出一种基于结构分解和因子分析的贝叶斯网络隐变量发现算法(S-FAHF)。S-FAHF算法的基本思想:首先,利用联合树算法生成具较强依赖关系的变量子集;其次,利用因子分析思想,通过求变量子集的特征值和累积贡献率确定变量子集中隐变量个数;然后,利用负荷矩阵确定与隐变量相关的显变量;最后,利用BIC打分函数和数据拟合度函数测试所发现的隐变量的有效性。第二,针对仅利用观察数据不能够准确确定隐变量与显变量之间因果关系的问题,提出将扰动学习方法(Intervention Learning)与S-FAHF算法相结合学习含有隐变量的贝叶斯网络最优结构的算法。该算法的基本思想是:首先,从初始网络模型中找出要学习的局部网络;其次,对网络中含有的隐变量进行扰动产生扰动数据并利用扰动数据和观察数据进行实验;然后,根据变量概率分布的变化确定含有隐变量的局部网络结构;最后,利用数据拟合度函数检验该方法的性能。通过现实生活中的数据,对本文所提出的方法进行了综合评估。实验表明,当准确确定网络中含有的隐变量个数及局部网络结构后,数据和网络的拟合度会明显提高,并显示了隐变量在实际生活领域中的广泛存在性和潜在应用性。
其他文献
随着计算机及网络技术的快速发展,对重要而敏感信息的保护受到高度的关注。门限签名是现代密码学的重要分支,在保证数据的完整性、私有性等方面有着极其重要的作用。门限签名可
胎儿心电(Fetal Electrocardiogram:FECG)中包含着大量的生理信息,能够直观的反应围产期胎儿的生长发育和健康状况,达到对疾病及时发现、及时治疗的目的。目前FECG的主要检测
流形学习方法的研究逐渐成为了机器学习领域里的一个重要分支。针对图像特征流形的问题,本文提出了图像特征流形的谱估计学习框架,包括:(1)分析了图像流形拓扑不变性的相关谱
随着计算机技术的不断发展,软件测试渐渐成为一项耗费大量资源的活动,因此人们一直在研究使用何种方法来降低软件测试的成本。经验及实践表明,组合测试是一种实际而有效的测
互联网迅速膨胀所带来信息大爆炸使得现代搜索引擎正面临前所未有的性能挑战,每天约有数百亿条用户查询请求需要处理。作为搜索引擎处理用户查询的核心功能――倒排索引交集求
目标跟踪系统是一种典型的非线性、非高斯随机系统,而且在这一系统中存在的系统状态及参数估计等问题历来是该领域研究的难点与热点。为此,本文探讨了一种基于粒子滤波算法对机
流形学习方法是近年来深受人们关注的学习方法之一。本文以流形中或者流形间切丛上的仿射联络算子为出发点,提出了仿射联络算法。本文主要取得的成绩包括:(1)提出了基于张量数
随着互联网技术的迅速发展,Web信息呈爆炸式增长,在海量的数据中,如何快捷高效的搜索获取需要或者感兴趣的信息逐渐成为人们关注的焦点。Web个性化服务在一定程度上解决了信息高
LXI(LAN eXtension for Instrumentation)技术是局域网在仪器领域的扩展,由此构建的仪器测控平台具有成本低、可重构性强以及仪器组件可以分布式部署等优点,LXI已经成为仪器总
印鉴作为一种身份和行为的象征,广泛应用于社会生活的各个方面。随着计算机技术的发展和刻章工艺的提高,由伪造印鉴引起的犯罪案件时有发生。而印鉴识别系统的出现,实现了印鉴的