结合信息检索技术的半监督文本分类方法

来源 :苏州大学学报：自然科学版 | 被引量 : 0次 | 上传用户：jiangur2

【摘要】

：

搜索引擎的查询结果和查询关键词与某一个文本类别应该具有一定关联.基于这样的假设,针对文本分类问题,根据小样本集提取特征词构建查询并从查询结果中下载网页样本,将下载的

【作者】

：

贾志洋高炜王勇刚

【机构】

：

云南大学旅游文化学院,苏州大学数学科学学院,云南师范大学信息学院

【出处】

：

苏州大学学报：自然科学版

【发表日期】

：

2012年1期

【关键词】

：

文本分类半监督学习信息检索搜索引擎 text classificationsemi-supervised learninginformation retr

【基金项目】

：

国家自然科学基金，云南省教育厅科学研究基金

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

搜索引擎的查询结果和查询关键词与某一个文本类别应该具有一定关联.基于这样的假设,针对文本分类问题,根据小样本集提取特征词构建查询并从查询结果中下载网页样本,将下载的网页样本进行去重、去噪、提取正文等处理后,判断其类别并扩充到初始样本集,最终使用扩充后的实验样本集学习训练朴素贝叶斯文本分类器,并对分类器的分类效果进行了测试.实验结果表明,结合信息检索技术的半监督分类器的分类准确率相对于使用小样本构建的分类器具有较大的提高.更多还原

其他文献

论教师的审美人格

素质教育的理论与实践在前所未有的意义上提升了教师自身素质的要求.完善的人格是教师从教的最基本的条件.而教师的审美人格作为高层次的人格要求,对于完善教师的人格结构具

期刊

教师审美人格人格结构人格特征素质教育

社会主义能够解决“经济核算”难题吗？——“苏联模式”问题和“中国方案”

在社会主义所有制结构和运行机制的框架下,结合苏联和中国的经济史,对于社会主义是否能够解决米塞斯称谓的社会主义“经济核算”难题所进行的研究结果表明,以指令性的计划经

期刊

社会主义经济核算中国特色市场经济“中国方案”“苏联模式”

Fyzzy向量组的相关性

建立Fuzzy向量组及向量组相关性的概念,并就向量组相关性同题给出若干命题与推论.

期刊