【摘 要】
:
互联网容纳了海量的文本信息,文本分类系统能够在给定的类别下,自动将文本分门别类,更好地帮助人们挖掘有用信息.介绍了基于词频分类器集成文本分类算法.该算法计算代价小,分类召回
论文部分内容阅读
互联网容纳了海量的文本信息,文本分类系统能够在给定的类别下,自动将文本分门别类,更好地帮助人们挖掘有用信息.介绍了基于词频分类器集成文本分类算法.该算法计算代价小,分类召回率高,但准确率较低,分析了导致准确率低的原因,在此基础上提出了基于改进词频分类器集成的文本分类算法,改进后的算法在文本权重更新方面做了参数调整,使得算法的准确率有显著提高,最后用实验验证了改进后算法的性能.实验结果表明,基于改进词频分类器集成的文本分类算法不仅提高了分类的准确性,而且表现出较好的稳定性.
其他文献
药品是医疗卫生机构不可缺少的重要组成部分,如何对药品在管理、供应、指导、咨询等环节进行科学有效的把关。更好的为防病、治病、预防、保健服务,是每位药品管理人员非常重要
为更好地发挥屋顶花园经济效益,本文试通过对南京市醺花园休闲餐厅附属屋顶花园中的各类景观设计要素进行分析、评价,探究在公共餐厅附属屋顶花园景观设计中,如何更好地优化
豆料植物取氮有道,靠和根瘤菌形成的共生关系固定大气中的氮.固氮过程的关键在于有一个促使根瘤菌的进入同时又有拒绝土壤中大量不受欢迎的入侵者的分子识别系统.1990年,该识
本文以提升投资效益为工程造价管控定位,全面梳理国内外工程投资效益评价维度与方法,结合国网公司、省公司对工程造价管理与评审等相关要求,设计了以提高工程投资效益为导向
介绍了仿人机器人运动控制研究现状,通过对步行机器人稳定性判据ZMP分析,提出通过控制踝关节转动角度来调节ZMP的位置,以保证机器人行走的稳定性.根据模糊控制理论,设计出步行机器
《吉首大学学报(社会科学版)》(ISSN 1007-4074,CN 43-1069/C)是吉首大学主管、主办的人文社会科学类综合性学术理论期刊。创刊于1980年,双月刊,国内外公开发行。为中文社会
火山爆发、飓风、山体滑坡、海啸、地震--这些大自然杀手的惟一确定的特性是,它们总会卷土重来,一而再,再而三.我们惟一的防御措施是:更有效地预测和保护.
一份新的研究报告称,德国科学家最近发明了一种新技术,利用这一技术可改善人体的触觉功能,而且用两种不同的药物能加强或者减弱这种作用.研究人员认为,这一发现将会引导我们
中西方不同的文化背景下,社会文明发展支配下的画家和赞助人对艺术的发展有不同的推进方式.在西方文化语境中,"赞助人"的解释更加贴近"雇主",艺术家和艺术赞助人之间维持着一
一种仿人眼晶体的微型透镜将改变数十亿美元的照相手机市场.在所有家用电器中,照相手机是最热门的商品之一,2004年的销售量达到17000万台.这种小玩意儿已经是如此普及,当您看