基于独立性分析的贝叶斯网络结构学习

被引量 : 0次 | 上传用户:buyaodiua1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯网络(Bayesian Network,BN)是概率论与图论相结合的产物,它是一个解决不确定性人工智能问题的有效工具。学习BN的结构需要从数据中确定BN的节点之间的依赖关系。这是一个非常重要的挑战,并且在过去的几十年里已经得到了广泛的研究。然而,从数据中学习最优的BN的结构已经被证明是一个NP难问题。独立性假设是解决这一问题的最直接和有效方法之一,它可以极大地简化BN的结构,并且能够改善条件概率的估计。贝叶斯网络分类器(Bayesian Network Classifier,BNC)是为分类问题而设计的特殊类型的BN。朴素贝叶斯(Naive Bayes,NB)是最简单的BNC,它假设在给定类变量的条件下,所有的属性之间都是相互独立的。然而,在现实中,许多学习任务中的属性是相互关联的。因此,NB的独立性假设可能会影响其分类性能。结构扩展是最直接并且十分有效的一种能够放宽NB的独立性假设方法,因为属性之间的依赖关系可以明确地由结构中的有向边来进行表示。在基于结构扩展方法放宽NB独立性假设的BNC中,6)阶依赖贝叶斯分类器(6)-dependence Bayesian Classifiers,KDB)由于能够表示属性之间的6)阶依赖关系而受到了研究人员的广泛关注。KDB通过使用信息论测度,例如条件互信息去构建它的网络拓扑结构,并且使用参数6)去控制偏差和方差的平衡。然而,在构建网络结构的过程中,KDB忽略了一些不重要的依赖关系,并且引入了隐式独立性假设。未经验证的独立性假设可能会导致次优的网络拓扑结构和有偏差的条件概率估计。因此,本文主要对学习属性之间依赖关系的同时验证网络拓扑结构中的独立性假设的合理性进行了研究。为了解决这一问题,本文提出的6)阶独立贝叶斯分类器(6)-independence Bayesian Classifier,KIBC)算法推广了条件互信息的定义去学习以类变量或预测属性为条件的依赖关系。除此之外,从训练数据中学习的网络拓扑结构不能够精准地表示不同测试实例中隐含的依赖关系。因此,为了能够充分地利用不同测试实例中的信息,KIBC使用局部互信息和局部条件互信息去为每一个测试实例学习一个对应的局部模型。两种不同的网络结构所表示的依赖关系将分别更适合于拟合有标签和无标签数据。最后,KIBC使用集成学习策略,将从训练数据中学习的模型和从测试实例中学习的模型结合起来去完成分类。为了评估本文提出的KIBC算法的有效性,本文实验部分分别在0-1损失、RMSE、偏差和方差方面对比了KIBC与其它算法在40个数据集上的表现。此外,Friedman检验和Nemenyi检验被用来对实验结果进行分析。实验结果显示,与先进的单模型BNC(例如,SKDB和CFWNB)和集成BNC(例如,WATAN、IWAODE、WAODE-MI、TAODE和DWAODE)相比,KIBC展现出了显著的优势。
其他文献
新麦草因具有抗旱、耐寒和持久性好等特性,在我国北方寒冷干旱草原区人工草地建设和植被恢复方面发挥着重要作用。但种子生产受开花期短、种子产量不稳定、种子不耐贮藏等因素影响,导致种子生产和贮藏存在困难,也制约了这一优良草种的进一步推广利用。本研究针对以上问题,从新麦草开花习性观测、春季追肥、喷施生长调节剂、种子贮藏以及陈种子引发等方面对新麦草种子生产中的关键技术进行全面系统研究,为新麦草种子生产提供初步
学位
膨胀土因其超强的胀缩性,素有“工程癌症”之称,给所在地区造成了许多灾害,对此,就必须将膨胀土改良,以减少因其引起的各种灾害。煤矸石是煤矿区产量最大的固体废弃物,大量堆放不仅对环境造成巨大危害,并且严重危害人们的身体健康。纤维加筋土是近年来发展起来的一种新型加强复合材料,随着生产力的发展,各种人工合成纤维逐渐被运用到土体改良中而且取得了很好的效果。为了解决膨胀土在实际工程中产生的问题,以及综合处理煤
学位
本试验于2021年在内蒙古农业大学职业技术学院科技示范园区进行,以蒙农杂种冰草为材料,通过单因素随机区组设计,研究了在行距20cm、行距30cm、行距40cm、以及行距30cm、60cm交替排列下种植蒙农杂种冰草对其生长和产量的影响。对不同行距配置下蒙农杂种冰草的主要农艺性状、光合指标、土壤基础养分及草产量进行测定。主要研究结果如下:1、不同行距会影响蒙农杂种冰草的出苗率。行距30cm时的出苗率为
学位
随着我国高速公路路网的逐步完善,全面推进公路养护管理体系建设迫在眉睫。内蒙古自治区交通运输厅发布的《内蒙古自治区“十四五”公路水路交通运输发展规划》中明确指出,科学的公路养护管理是构建更加安全、便捷、高效、绿色、经济、文明的现代化公路交通运输体系的重要基石。因此,建立全寿命、高质量的养护管理体系是自治区乃至全国公路高速发展过程中的重大议题。在路面管理系统中,路面使用性能预测是分析过程中极其重要的环
学位
随着我国城镇化的高速发展,对草坪草的需求与日俱增,我国草坪业得到了快速发展,对于优良草坪草种的需求也急剧增加。我国北方夏季高温少雨,冬季寒冷干燥,地区适应性较强的草坪草种较少。羊茅(Festucarubra)具有抗逆性强、青绿期长、触感柔软等优点,是我国北方用作草坪草的重要草种。本研究主要对呼和浩特地区种植的3个羊茅品种(系):浑善达克达乌里羊茅(Festuca dahurica‘Hunshand
学位
本文以2009—2019年中国商业银行为研究对象,采用固定效应模型,系统考察了宏观审慎政策和“双支柱”调控框架对商业银行风险承担的影响。研究发现,宏观审慎政策不仅能够降低商业银行风险承担水平,而且也能够抑制宽松的货币政策所导致的风险,“双支柱”调控框架能有效发挥金融稳定作用。异质性分析发现,与宽松的宏观审慎政策相比,紧缩的宏观审慎政策在降低商业银行风险承担方面效果更为明显;与四大国有商业银行相比,
期刊
土壤健康是土壤物理、化学及生物性质的综合体现,也是生态系统提供各种服务的重要基础。荒漠草原在我国广泛分布,且多位于气候干旱土壤贫瘠地区,其抵抗干扰能力相对脆弱,因而也被认为是对气候变化和认为干扰最为敏感的生态系统之一。近年来,不合理的放牧措施导致荒漠草原生态系统遭到严重破坏,植被及土壤发生大面积退化。目前关于放牧对荒漠草原土壤健康影响的研究还相对较少。本研究依托内蒙古四子王旗荒漠草原的长期放牧试验
学位
叶片是风力发电机中最主要的受力部件,其性能质量会直接影响到整个发电机组的发电效率与运行维护的安全,因此,对叶片的选材、结构气动外形设计是风力发电机中最关键的技术问题。通常来说,叶片的成本占整体的20%-25%,在我国约有25%的风力发电场处在风沙较为频繁的环境下,恶劣的风沙环境会对风力发电机叶片产生冲蚀磨损作用,使得气动外形受到破坏、风能利用系数降低,甚至会造成整个叶片损毁,机组坍塌等严重后果。内
学位
林地类型识别是卫星遥感监测中的关键问题,由于低分辨率遥感影像无法达到树种精确识别的要求,高分辨率遥感影像包含丰富的光谱信息、空间几何信息和纹理特征信息。因此,近几年来,高分辨率遥感影像是树种识别领域研究的重点。传统的基于像元的分类方法无法有效利用影像中丰富的空间和纹理特征信息,同时也存在着“分类噪声”的问题,不能准确提取林地类型信息。而面向对象的分类方法是基于影像分割对象特征的提取方法,并且可以有
学位
恩格贝生态示范区是典型的生态脆弱地区,该区域水土流失严重,人为干扰性极大。对该区域进行研究,可为该区域景观的科学管理和生态安全的提升提供参考,同时为沿黄河流域沙漠治理与生态系统修复提供评价技术依据。基于此,本文以恩格贝生态示范区为研究区,对该区域2005、2010、2016和2021年的4期遥感数据进行解译,获得景观分类图,对该区域的景观格局变化和生态风险进行研究。首先,使用动态度、转移矩阵定量描
学位