基于属性选择的多维贝叶斯网络分类器研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:berry909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多维数据分类问题是数据分析中的重要研究方向之一,由于数据属性的增多,数据常常包含许多混淆变量,许多学者把属性选择引入到分类学习中.随着研究的深入,我们获得的数据总是由于种种原因而缺失,一些研究人员便提出了基于缺失数据的多维贝叶斯分类算法,但这些算法都有一定的局限性或者要求数据随机缺失.本文将两种属性选择算法与多维扩展的稳健贝叶斯分类器相结合,对非随机缺失数据下的分类问题进行了研究.本文首先介绍一个属性选择方法—类电磁机制算法,仿照电磁中电荷的相互作用,对数据进行属性选择,删除冗余变量和不相关变量,约减属性,进而降低分类模型的计算复杂度,提高分类效果.并提出一种新的多维分类器,该分类器是对稳健贝叶斯分类器的一种扩展,在非随机缺失数据下,对多维分类问题建立数学模型,不直接估计后验概率的具体值,而是对其进行近似,用其近似值作为评价标准,达到分类预测的目的.为了检验模型的优劣,在三种常见多维分类数据集上进行仿真实验,将其与其它算法进行比较,用分类精度作为衡量指标.结果表明本文提出的方法有良好的分类性能.其次,将优化领域最热门的智能算法之一—蚁群优化算法引入到属性选择中,该方法是模拟蚂蚁觅食行为的一种启发式算法.一个人工蚂蚁对应于一个解决方案,每个属性变量在解决方案中代表一个节点,目标是寻找最短路径,蚂蚁遍历所有节点,采用一定的规则确定是否选择属性变量,确定最终解决方案,即确定属性子集.文中采用一种改进的蚁群优化算法对问题进行属性选择,然后把多维贝叶斯分类器的类变量定义为一个复合类变量,属性集合即是前面获得的属性子集,将问题转化为一维问题来求解.仿真实验证实了相对于其它算法该方法有良好的分类效果.
其他文献
一致性问题作为多智能体协调控制中的典型问题,在军事、航空、工业甚至是人们的日常生活中都有着广泛应用。近年来,二阶多智能体系统由于本身具有更复杂的节点动态、更广阔的
介绍了金华市双季稻稻作方式的现状以及目前规模种植大户双季稻不同稻作方式的产量、生产成本和效益,分析了早晚稻直播、早晚稻机插和晚稻手插等稻作方式的优点和缺点,指出未
摘要:工程造价的控制与管理是一个动态的过程。对工程造价的管理既要全面又要有所重点。在工程实施过程的各个阶段,时时要有控制造价的经济概念,利用掌握第一手资料的优势,认真分析和充分利用建设周期中的重要信息,把握住市场经济的脉搏,减少或避免建设资金的流失,最大限度地提高建设资金的投资效益。本文分析了影响建筑工程造价预算的原因,探讨了建筑工程造价预算控制的措施。  关键词:工程造价;预算控制;影响原因;措
期刊
摘要:建筑工程机械管理是一个复杂的综合性课题,除了把好管、用、养、修关之外,还必须做到领导重视,各级机械管理人员、机械操作人员、维修人员及相关配合人员之间责任明确,做到有章可循、有据可查。本文探讨了建筑工程机械管理中存在的问题及对策。  关键词:建筑工程;机械管理;问题;对策  中图分类号: TU761 文献标识码: A 文章编号:  机械设备是施工企业承包工程任重要基础,是进行机工程施工的主要手
期刊
经典风险模型是一类描述保险公司经营过程的基本数学模型,它主要研究了关于“小索赔”情形下的破产理论。然而随着现代保险公司风险经营的发展,大额索赔不断出现,为了更为客观地
本文从最简单熟悉的Cauchy-kavalevskaya型方程组入手,运用分层理论研究大尺度三维干的大气环流方程组的拓扑学性质及其定解问题的适定性,以及适定的定解问题(包括初值问题、边
对任意素数幂次q,令αq(δ)表示码的渐近理论中的标准函数,即,给定渐近相对最小距离下q-元码能达到的最大渐近(相对)信息率.码的渐近理论一个核心问题是寻找αq(δ),0
试想在不给任何蓝图的情况下告诉机器人为你建造一座有5间卧室的房子。现在,科学家们在《科学》杂志上报告说,他们制造了能够这样做——即在没有总体计划的情况下进行建造工
自适应重复学习控制(RLC)和迭代学习控制(ILC)方法对研究复杂的未知非线性系统起到了很大的促进作用,相较于传统的控制方法,学习控制不依赖于系统精确的动态模型,可以利用较