【摘 要】
:
在数据挖掘领域中,分类是一种非常重要的技术.然而,现有的多种分类技术如贝叶斯,决策树等都是单分类器技术.目前单分类器性能的提升已经达到了一个瓶颈,人们遂提出了多分类器
论文部分内容阅读
在数据挖掘领域中,分类是一种非常重要的技术.然而,现有的多种分类技术如贝叶斯,决策树等都是单分类器技术.目前单分类器性能的提升已经达到了一个瓶颈,人们遂提出了多分类器组合的概念.多分类器组合使用多个基分类器进行分类,并综合所有分类结果形成一个最终结果.实验表明,多分类器组合能显著提高分类器的分类性能.因此对其进行研究,具有重要的理论价值及现实意义.本文首先对多分类器组合的各个主要研究方向做了综述性的阐述.包括多分类器组合的概念,构建多分类器组合的关键问题,例如器组合的多样性评价,基分类器的生成策略,基分类器的选取,以及基分类器的组合方法等相关问题的基本概念和典型算法.在已有研究成果的总结上,本文针对多分类器组合的基分类器选取问题提出了两种尝试性的算法.首先,如何利用多样性指导组合的生成是研究的一个重要问题.本文提出了一种Boosting方法与多样性评价指标相结合的基分类器选取方法.进而,本文指出了传统的Boosting方法存在的不足,提出了一种新的利用当前测试实例来动态地对基分类器进行权重赋值的方法,试图克服传统Boosting方法中静态权重赋值所可能带来的缺陷.最后,介绍了数据挖掘平台Weka系统的概况及其架构,在此平台上实现上述提出的方法,并通过实验比较了上述方法,与传统的多分类器组合算法如Boosting算法,及经典分类器算法如决策树分类器的分类性能.实验结果与分析表明,本文提出的这些算法在大部分数据集上都具有更好的分类性能.
其他文献
有道是:成功见修养,失败显真功。面对失败,有的人失魂落魄,一败涂地;有的人满腹牢骚,怨天尤人;有的人怒发冲冠,困兽犹斗;有的人则一走了之,逃之夭夭。而有的人失败不言败,失败
在我国现代文学史上,曾出现过三个较重要的现代主义诗歌流派--象征派、现代诗派、九叶诗派,对它们各自的特点和文学史价值进行探讨,对于社会主义新时期诗歌的发展具有一定的
目的:探讨用尿液电导率反映肾小管浓缩稀释功能。方法:用UF-1000全自动尿沉渣分析仪和尿渗透压仪对400例尿糖、尿蛋白阴性尿标本以及200例尿糖(++)、(+++)尿标本分别测定电导
目的:研究不同剂量五味子多糖灌胃给药对小鼠酒石酸锑钾扭体反应和大鼠甲醛致痛行为的抑制作用.方法:将50只小鼠随机分为生理盐水组,阿司匹林组(100mg/kg)和五味子多糖20,50
近年来,产、学、研合作逐渐引起政府和学界关注,政府加强了对产、学、研合作的重视,学界也加强了对产、学、研合作的研究。综合起来,我国目前产、学、研合作研究主要集中在以
在糖类化合物合成中,微波辅助技术是一种有效手段。应用微波辅助技术研究了五乙酰基保护葡萄糖与直链醇在固体酸蒙脱石K-10和4×10-10m的分子筛作用下的烷基氧糖苷化合物的合
本文分析研究比较探索中国现当代文学农民形象的流变轨迹。从“五四”新文学启蒙运动开始 ,以鲁迅为代表的一批作家最早描绘了中国农民的形象 ,从民族文化历史时代的高度对“
随着中国经济的高速发展,中国化妆品市场增长速度远远高于国民经济的平均增长速度,中国现在已经成为全球最大综合性市场。与此同时,随着时代的前进、社会生活节奏的变化和消
转录因子是生物体中的重要的调控因子,用来激活或抑制表达的编码或非编码基因,通过它们可以进一步影响或控制多种生命活动过程。如同在所有生物体中一样,在植物中,转录因子也