基于粗糙集加权的文本分类方法研究

来源 :情报学报 | 被引量 : 0次 | 上传用户：nuclear01

【摘要】

：

文本自动分类是当前智能信息处理中一类重要的研究课题.本文分析了基于统计理论的文本分类的基本特点,提出采用可变精度粗糙集模型中的分类质量构造新的特征词权重计算公式.

【作者】

：

胡清华谢宗霞于达仁

【机构】

：

哈尔滨工业大学

【出处】

：

情报学报

【发表日期】

：

2005年1期

【关键词】

：

文本分类变精度粗糙集模型分类器文本自动分类智能信息处理支持向量机特征词加权方法研究课题基本特点

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本自动分类是当前智能信息处理中一类重要的研究课题.本文分析了基于统计理论的文本分类的基本特点,提出采用可变精度粗糙集模型中的分类质量构造新的特征词权重计算公式.这种新的加权方法,相对于广泛使用的逆文本频率加权方法,大大改进了文本样本在整个空间中的分布,使得类内距离减少,类间距离增大,在理论上将提高样本的可分性.最后利用支持向量机和K近邻两种分类器,验证了这种新的加权方法对分类效果确实有所提高.

其他文献

人际竞争情报研究基本方法——网络建模

依据社会网络分析方法和人际竞争情报研究主题,本文从人际竞争情报建模对象、人际竞争情报网络模型描述、人际竞争情报网络静态研究、人际竞争情报网络动态研究四个方面论述

期刊

人际竞争情报社会网络分析网络建模human competitive intelligence social network analysis netw

基于法律框架网络本体的信息检索研究

利用框架语义学原理,参考美国加州大学伯克利分校的FrameNet工程,我们构建了法律框架网络本体,针对当前网络信息检索存在的查准率低等问题,探讨中文法律框架网络本体应用之下

期刊

本体框架语义学框架网络法律信息检索ontology frame semantics frameNet law information retr

不同垂直骨面型骨性Ⅰ类患者颞下颌关节位置与形态的差异性研究

目的:探讨不同垂直骨面型骨性Ⅰ类错畸形患者颞下颌关节位置与形态的差异。方法:筛选骨性Ⅰ类错畸形成人患者108例,分为低角组(37例)、均角组(39例)、高角组(32例)。对各组患

期刊

垂直骨面型颞下颌关节(TMJ)CBCT骨性Ⅰ类Vertical skeletal featuresTemporomandibular joint(TMJ

山东台儿庄：古城文化焕发新生机

每年4月份，很多人都会不约而同地来到位于山东省枣庄市的台儿庄，以各种形式纪念1938年那场著名的“台儿庄大捷”。久而久之，台儿庄也就成为联结海内外中华儿女历史情思的重要平

报纸

65nm／45nm工艺及其相关技术

介绍了65 nm/45 nm工艺的研究成果、157 nm F2 stepper技术、高k绝缘层和低k绝缘层等技术.着重讨论了157 nm F2stepper的F2激光器、透镜材料、光刻胶和掩模材料问题.

期刊

65nm/45nm工艺157NMF2光刻机高k/低k绝缘材料nm/45 nm technology157 nm F2 stepperhigh k/

财务共享服务对管理会计建设的作用分析

自我国的社会主义市场经济体制建立以来,我国企业的发展和变革逐步深入,在各个方面都有了很大的突破和改变。并且随着市场需求的增多和多元化,以及互联网等一系列高新技术对

期刊

财务共享服务管理会计

基于粗糙集加权的文本分类方法研究

其他学术论文