基于改进信息增益的ACO-WNB分类算法研究

来源 :计算机仿真 | 被引量 : 0次 | 上传用户:hwguomin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对朴素贝叶斯分类算法对文本分类性能不高的问题,提出一种基于改进信息增益的ACO-WNB分类算法。首先,根据特征词在数据集中的词频分布情况加入调节因子,对特征词的贡献/干扰作用进行增强/抑制的调节,选择具有强区分度的特征形成特征子集,提高IG处理非均衡数据集的准确率。然后,将蚁群优化算法(ACO)和加权朴素贝叶斯模型相结合,利用ACO对权重进行迭代和全局寻优,生成ACO-WNB分类器,提高对文本数据的分类效率。使用典型新闻数据集将改进前后的算法对比分析,实验表明IG (可以有效去除冗余的高频特征,对非均衡
其他文献
本研究基于SARS报道的微型语料库,旨在分析:主题词与主题表达之间的关系;关键主题词与它们的联想词以及搭配词之间的相互关系;有关SARS报道中用词的语言学特点。研究结果发现,在有
本文通过艺术范型、艺术心理、歌诗视角等对钱锺书<诗经>艺术研究进行评介,用意在于说明只有丰厚的研究资源,独特的研究视角和运用综合型的研究方法,才能使古老的<诗经>学得
多元智能理论是当今世界最著名的发展心理学家、美国哈佛大学资深教授霍华德&#183;加德纳1983年提出的一种心理学理论。在加德纳看来,人的智能包括一种或一组个人解决问题的能
目的:观察苯海拉明肌肉注射治疗眩晕急性发作的疗效。方法:将我院急诊就诊的病因诊断明确的反复发作眩晕患者分为苯海拉明组(n=471)和常规治疗组(n=445)。苯海拉明组除给予苯海拉明
目的:研究牻牛儿苗(Erodium stephanianum Willd.)的化学成分。方法:采用硅胶、SephadexLH-20柱层析并结合重结晶等方法对牻牛儿苗的95%乙醇提取物的乙酸乙酯萃取部位进行分离纯
金石画派是清代晚期画坛上受金石研究风尚影响而崛起的一个新画派。其艺术风格对晚清画坛及后世产生了极其深远的影响。本文主要通过阐述金石画派的产生背景及艺术特点。来分
介绍了我国天然气市场快速发展的现状,可以预期,在“十二五”期间还将持续快速增长;随着我国天然气需求量急剧增大的同时,出现了支线运输、调峰、管网盲区液化天然气运输等问题,因
为理解垂直条形均布荷载下地基附加应力公式,文中尝试用角点法,通过叠加求得到矩形面积上均布垂直荷载作用下地基附加应力表达式,然后再根据式中矩形边长的变化情况,推导出垂直均
目的:抑郁症状是一种常见的、使人衰弱的、疾病负担很重的公共卫生问题。研究表明肠道疾病与抑郁症状密切相关,而幽门螺旋杆菌(Helicobacter pylori,H.pylori)感染会引起胃肠菌群的正常生理状态的改变,是胃肠道疾病最常见的致病菌之一。本研究希望通过对幽门螺旋杆菌感染状态的检测,探讨天津市普通人群中幽门螺旋杆菌的感染状态和抑郁症状的关联。方法:本文是一项横断面研究,研究人群来自天津慢
若干年后的中国农村将是什么状况?也许到那时,高素质的劳动力已完全离开农村,低素质的农村劳动力,加上资本缺乏所带来的技术进步乏力、风险抵抗能力下降,导致农业产出的严重