结合信息检索技术的半监督文本分类方法

来源 :苏州大学学报:自然科学版 | 被引量 : 0次 | 上传用户:jiangur2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎的查询结果和查询关键词与某一个文本类别应该具有一定关联.基于这样的假设,针对文本分类问题,根据小样本集提取特征词构建查询并从查询结果中下载网页样本,将下载的网页样本进行去重、去噪、提取正文等处理后,判断其类别并扩充到初始样本集,最终使用扩充后的实验样本集学习训练朴素贝叶斯文本分类器,并对分类器的分类效果进行了测试.实验结果表明,结合信息检索技术的半监督分类器的分类准确率相对于使用小样本构建的分类器具有较大的提高.更多还原
其他文献
素质教育的理论与实践在前所未有的意义上提升了教师自身素质的要求.完善的人格是教师从教的最基本的条件.而教师的审美人格作为高层次的人格要求,对于完善教师的人格结构具
在社会主义所有制结构和运行机制的框架下,结合苏联和中国的经济史,对于社会主义是否能够解决米塞斯称谓的社会主义“经济核算”难题所进行的研究结果表明,以指令性的计划经
建立Fuzzy向量组及向量组相关性的概念,并就向量组相关性同题给出若干命题与推论.
结合物理教学实践中的经验和体会,主要阐述物理教学在素质教育过程中所起的重要作用.