基于自助平均的朴素贝叶斯文本分类器

来源 :计算机工程 | 被引量 : 0次 | 上传用户：element_wq

【摘要】

：

针对单词簇上训练朴素贝叶斯文本分类器概率估计偏差较大所导致的分类精度较低问题,在概率分布聚类算法得到的单词簇的基础上,根据单词与簇间互信息建立有序单词子序列,采用

【作者】

：

白莉媛黄晖刘素华阎秋玲

【机构】

：

河南工业大学信息科学与工程学院,河南工业大学理学院

【出处】

：

计算机工程

【发表日期】

：

2007年15期

【关键词】

：

分布聚类文本分类朴素贝叶斯分类器自助平均 distributional clustering text classification naive Baye

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对单词簇上训练朴素贝叶斯文本分类器概率估计偏差较大所导致的分类精度较低问题,在概率分布聚类算法得到的单词簇的基础上,根据单词与簇间互信息建立有序单词子序列,采用有放回随机抽样对序列构造规模相当的样本集,并将估计出的参数的平均值作为训练得到的参数对未知文本进行分类.公共文本实验数据集上的实验结果表明,该文提出的训练方法相对于传统的朴素贝叶斯分类器训练方法能够获得更高的分类精度且过程相对简单.

其他文献

三伏贴与三伏针刺治疗缓解期支气管哮喘的效果对比

目的比较三伏贴与三伏针刺治疗缓解期支气管哮喘的临床效果。方法选取2016年7月~2017年12月山东青岛中西医结合医院收治的80例缓解期支气管哮喘患者作为研究对象,按照随机数

期刊

缓解期支气管哮喘三伏针刺三伏贴

中国带动全球近1／3经济增长贡献率是美3倍

“世界第二大经济体的经济可能正在企稳。”对于中国8日公布的7月份外贸数据，国际媒体纷纷给出乐观评价。7月，中国进出口分别增长10．9％和5．1％，远超外界预期，也扭转了6月份进出口数据

期刊

中国经济经济增长贡献率全球经济进出口世界外贸

重庆机床定力创新装备西部而行走无疆

从＂一五＂、＂二五＂、＂三线建设＂到改革开放、西部大开发,50多年的建设,使西部装备制造业形成了比较完整的体系。当前,在世界工业发达国家将制造业向我国转移和国家加大对全国老工业

期刊

西部大开发装备制造业创新机床重庆工业发达国家老工业基地改革开放

GC夹对三种食源性致病菌的rpoB-PCR-DGGE图谱的影响

旨在探讨不同的GC夹以及GC夹连接引物的不同位置对3种食源性致病菌的DGGE图谱结果的影响,合成6对RNA聚合酶β亚基编码基因rpo B引物(rpo B 1-6),含3种不同GC夹(GC-1,GC-2,GC-

期刊

副溶血性弧菌单增李斯特菌沙门氏菌GC夹rpo B-PCR-DGGE

戊戌维新后清政府化除满汉畛域的努力

清王朝作为一个少数民族统治的王朝,其统治者的身份地位要求对满汉实行有差异的政策,故满汉畛域自清王朝入关以来就一直存在,只不过在不同时期的表现形式和激烈程度并不相同

学位

化除满汉畛域戊戌维新后措施

一种入侵容忍的密钥分发方案

提出了一种入侵容忍的密钥分发方案。在该方案中，密钥的生成由若干服务器通过秘密共享机制协作完成，每个服务器并不知道所生成的密钥，只持有其秘密份额。密钥分发的过程同样基于

期刊

入侵容忍秘密共享密钥生成密钥分发intrusion-tolerant secret share key generation key distribut

边界的立与破

托妮·莫里森作为美国历史上最伟大的黑人女性作家之一,曾获得诺贝尔文学奖、普利策小说奖等许多重要文学奖项。其作品着眼于美国黑人的真实生活,通过敏锐的观察、细腻的笔触、生动的人物形象、独特的叙事手法以及魔幻现实主义的风格,对种族主义、女性主义等问题都做了深入的探讨。瑞典文学院在给她的诺贝尔文学奖颁奖词中就写道:莫里森“在小说中以丰富的想象力和富有诗意的表达方式使美国现实的一个极其重要方面充满活力”。小

学位

《秀拉》贱斥边界建立打破

平原人急进暴露高海拔地区导致体重下降(英文)

平原人暴露于海拔3500m以上高原,特别是急进高原之后存在体重下降现象,但其体重下降程度与高原反应相关关系目前未见报道。本研究选择修建青藏铁路可可西里昆仑山口区的120名

期刊

体重指数体重减轻高原青藏高原

MAG在CIMT2011上推出五大新技术

2011年4月12日，美艾格工业系统有限公司（MAG）在CIMT2011期间召开新闻发布会，重点介绍新研发的五大新技术，MAG全球总裁Daniel Janka先生、MAG亚洲区总裁李黎先生、MAG亚洲区销售总

期刊

MAG新技术新闻发布会工业系统亚洲区总经理总裁销售

可乐满CIMT2013新闻发布会及创新展示

CIMT213开展前夕。山特维克可乐满在其北京效率中心举行了新闻发布会。李贻善先生就任亚太区总裁并同时兼任大中华区总经理。李总在讲话中强调指出：继欧洲和美洲大区之后，山特

期刊

新闻发布会可乐创新亚太区总经理山特中华

基于自助平均的朴素贝叶斯文本分类器

与本文相关的学术论文