论文部分内容阅读
当前,应用贝叶斯网络的不确定知识推理实现各领域的智能功能已具有很大的趋势。贝叶斯网络结构学习通过建立有向无环图,挖掘变量之间的先后或因果关系,并予以直观全面的展示,在算法研究与实际应用等方面都受到广泛的关注。然而,由于当前的结构学习算法在进行贝叶斯网络优劣评价的时候,未能充分考虑得分的可分解性及局部结构的可继承性,导致贝叶斯网络的评价过程出现重复计算的问题。本文首先针对传统的结构学习遗传算法的个体编码在种群进化过程中,需要反复进行无环性检验的问题,提出一种新的个体编码方式,同时结合遗传过程中家族得分的可继承性,对结构学习遗传算法进行改进得到基于继承与优化的结构学习算法。随后将该算法应用于高血压疾病预防分析,得到年龄、家族高血压疾病史、体型为高血压主要影响因素等结论,进而提出高危人群需节制不良嗜好、保持健康体型以预防高血压疾病等建议。在继承与优化结构学习算法的基础上,分别在以下两方面对贝叶斯网络结构的学习进行了较为深入的改进研究:1)针对在大样本前提下推导得到的BIC得分在小样本建网方面的局限性,提出加权得分WS,并且引入爬山算法进行结构学习K2算法的节点顺序寻优,同时结合寻优过程局部结构的可继承性,设计了HC-K2算法。相比于上文的结构学习遗传算法,HC-K2算法可行解的搜索空间相对较小,但建网的效率更高。随后将该算法应用于小样本下的工业锅炉故障分析,得到锅炉出现磨损与裂纹会增大其泄漏风险等结论,为锅炉的安全预警提供建议。2)针对基于K2算法节点顺序寻优的结构学习算法建立多节点贝叶斯网络的低效问题,在继承局部结构的基础上,提出一种无需事先指定节点顺序的改进贪婪算法:Greedy-K2算法。相比于HC-K2算法,该算法是结果唯一的确定性算法,故未能在更大的范围内搜索可行解。然而实验表明,该算法更适用于多节点贝叶斯快速建网问题。随后将该算法应用于中国移动全球通客户流失分析,得到上月较少通话时长暗示当月高流失风险等结论,为锁定客户挽留目标提供建议。实验结果表明,基于继承与优化的贝叶斯网络结构学习算法、改进的贝叶斯网络优劣评价函数、改进的贝叶斯网络结点顺序确定的结构学习算法是合理与有效的,在实际应用中有广泛的应用意义。