【摘 要】
:
机器学习是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测的科学。在过去的几十年中,已经提出了诸如贝叶斯网络,神经网络和支持向量机等统计模型,并将其应用于许多现实生活中的应用中,例如医学诊断、搜索引擎和生物识别等等。贝叶斯网络分类器(Bayesian network classifiers,BNC)已在各种实际应用中证明了其具有竞争力的分类性能。具有高表达能力的高度可扩展的BNC
论文部分内容阅读
机器学习是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测的科学。在过去的几十年中,已经提出了诸如贝叶斯网络,神经网络和支持向量机等统计模型,并将其应用于许多现实生活中的应用中,例如医学诊断、搜索引擎和生物识别等等。贝叶斯网络分类器(Bayesian network classifiers,BNC)已在各种实际应用中证明了其具有竞争力的分类性能。具有高表达能力的高度可扩展的BNC逐渐成为机器学习领域中的重要研究方向。贝叶斯网络分类器是在不确定条件下进行知识表示和推理的强大工具,通过学习更合理的网络结构,BNC通常可以实现更高的分类准确性。然而,学习不受限的贝叶斯网络的结构已被证明是NP难的。为了解决这一问题,学者们正在研究受限网络结构的相关知识。在众多受限的BNC中,NB假定所有属性在给定类别标签的条件下都是独立的。即使在大多数数据中属性之间的条件独立性假设是不现实甚至是错误的,NB分类器的性能也令人惊讶地良好。为了弥补NB分类器的某些局限性,Friedman等人引入了在属性之间添加了1阶依赖关系的TAN分类器以放宽NB的的条件独立性假设。KDB更进一步,理论上允许任意阶的特征依赖关系表达,使用单个参数k可以在分类性能和结构复杂性之间取得良好的平衡。为了提高相对于单个模型的预测准确性,集成学习训练多类模型解决相同问题,并将其结合以获得鲁棒性更高的模型。AODE和WATAN方法作为一阶依赖的集成BNC,通过随机化从单个学习算法生成多个全局模型,平均来说可以帮助获得更好的整体准确性。从训练数据中学到的任何模型不一定适合所有测试实例。为了在未标记的测试实例中挖掘隐式依赖关系,以减轻过度拟合导致的分类偏差的负面影响,本文提出了面向贝叶斯网络分类器研究的通用标靶学习(UTL)策略。一方面,该框架将每个未标记的测试实例作为目标并构建了一个“不稳定”的贝叶斯模型BNC?。为了使BNC?和从标记的训练数据中得到的BNC?相互补充并有效地结合使用,本文应用相同的学习策略来构建它们。另一方面,本文基于信息论中的对数似然LL((?)|T)分析在特定实例中充分挖掘属性值之间的重要依赖关系来帮助优化网络结构。我们引入条件熵作为损失函数,以对数似然来测量BNC中的编码比特。我们以KDB为例,研究UTL对BNC?和BNC?的影响。本文将UTL应用于KDB上得到了UKDB模型。基于40个UCI数据集上的实验结果表明,UKDB的分类精度不仅优于单结构BNC(NB、TAN、KDB等),与集成模型(AODE、WATAN等)相比也有显著优势,有力证明了UTL框架的有效性。
其他文献
本文的研究是在镇江市重点研发计划(GY2017001)的资助下开展的。流动噪声是离心泵噪声的重要组成部分,对环境危害较大。仿生非光滑结构是气动声学领域中研究时间较长的一种降低
随着当代物质生活水平的提高,人们对能源的需求日益增长。氢能一直被认为是解决能源短缺和环境问题的理想清洁能源之一,燃烧时只产生水,不产生任何污染物。电解水提供了一种
本研究借鉴了前人对于精神观念因素、利他主义因素、遗体器官捐献态度等方面的研究成果,构建了精神思想因素对与家人沟通捐献遗体器官意愿影响的模型。在全球范围内,对器官移植供体的需求仍然较大。我国器官供需比例约为1:150,器官供给缺口非常大。前人研究发现精神因素对健康行为有重要影响。我国独特的思想文化环境也使人们对逝世后是否要捐献器官、遗体是否需要完整无缺的观念有很大的影响。在此基础上,本文主要探讨精神
众周所知,当今世界各个领域都需要科技的支持。目前在泰国,“泰国教师4.0”战略得到了许多学校的认可,即泰国教师把现代化的科技与课堂教学相结合。随着中国经济的不断发展,汉语已成为世界上使用最广泛的语言之一,许多国家和地区都掀起了“汉语热”,泰国也不例外。自从泰国开设汉语课之后,汉语教育覆盖了泰国的各个领域。但由于泰国汉语教育的教学层次、教学方案及相关政策不一致,导致目前泰国的汉语教育在教学模式及课程
MEMS(Micro-Electromechanical)火工品是未来火工品发展的主要方向,也是微起爆序列发展的必然选择。炸药油墨直写技术具有安全可靠、精度高和可塑性好等特点,已经成为MEMS火工
光催化产氢技术作为解决当前社会经济发展面临的能源和环境危机的有效方案之一受到越来越多的关注,但在工业化生产中依旧非常艰难。其中,太阳能-氢能的转换效率太低成为制约
镁合金作为一种发展前景可观的轻质商用金属工程材料,其应用研究及开发完全符合汽车工业、电子工业和航天工业等的发展要求。镁合金经轧制处理后可以显著提高其薄板性能,并且
裂缝是储层中油气的部分有效储存空间,同时也是主要的运移通道。随着油气勘探的不断发展,裂缝性油气藏成为了油气勘探中很重要的目标,而裂缝性油气藏的预测比较困难,研究地震
传统的雷达角度估计都是在高斯噪声背景下基于奈奎斯特采样定理的信号处理。为了抑制噪声的影响,通常采用累积量的方法对信号进行处理。虽然基于累积量方法的MIMO雷达DOD-DOA联合估计可以实现较好的参数估计性能,但它却存在着算法复杂、计算量大、实时性差等问题。基于此,一些学者将压缩感知技术应用于MIMO雷达的角度估计中,该算法突破了奈奎斯特信号采样的限制,并在一定程度上减少计算量。由于双基地MIMO雷
安塞油田黑山梁油区位于鄂尔多斯盆地陕北斜坡的中部,其主力产层为长6油层组,目前已进入注水开发阶段,逐渐暴露出含水上升快、产量递减严重、整体水驱效果较差的问题。针对黑