【摘 要】
:
由于朴素贝叶斯文本分类中的独立假设前提,使得在特征选择步骤能否准确有效地选出能代表文本的特征显得尤为重要,而特征选择标准中的MI标准与TFIDF标准其优缺正好互补,因此在
【机 构】
:
暨南大学计算机科学系,中山大学软件研究所
【基金项目】
:
国家自然科学基金资助项目(60173039);暨南大学自然科学基金资助项目
论文部分内容阅读
由于朴素贝叶斯文本分类中的独立假设前提,使得在特征选择步骤能否准确有效地选出能代表文本的特征显得尤为重要,而特征选择标准中的MI标准与TFIDF标准其优缺正好互补,因此在用朴素贝叶斯文本分类方法中的多项式模型实现了一个web页面分类系统———WEBCAT的基础上,提出将MI标准与TFIDF标准结合进行特征选择。实验显示:用改进的方法可以更准确地选出能代表文本的特征,文本分类结果也比单独使用TFIDF标准或单独使用MI标准进行特征选择的分类结果更加精确。
其他文献
古代文论的现代转换是古代文论现代研究的一贯追求。既往的经验和教训表明,在进行古代文论现代转换的时候,应警惕泛化倾向,要解决对古代文论本体性的理解问题。在解决对古代文化
近年来我国收入分配失衡问题日益突出,成为经济社会协调发展的重要制约因素。在财政收支框架下探讨我国收入分配不公问题,结果发现:(1)在财政收入环节,存在着税收体系不完善造成
大型商场经营过程中会产生大量的销售流水记录,对其进行数据挖掘,可以得到商场整体以及商场销售的各类商品每天的营业额、利润、利润率、打折力度等指标,对这些指标进行相关
<正>多年来,我一直非常喜欢、关注拳击,至今始终不渝。主流是拳手展现的优良技战特点、坚韧意志品质和良好职业操守带给我愉悦励志心境。想起或提及拳手,就好似邻座多年的朋
善于言情,是李商隐无题诗的根本艺术特征。无题诗中的深挚感情,通过婉曲的抒述方式以及营造朦胧意境、渲染悲剧气氛等艺术手法表现出来。成功抒写挚情是无题诗独具魅力的根本原
辞赋研究的视角转换 ,可以从以下三方面入手。首先 ,给辞赋以准确的定位 ,把它看作是精英文学 ,从创作难度、作家品位、传播层面等方面揭示它的精英文学特征。其次 ,要克服“
<正> “欧洲中心论”是资产阶级唯心主义历史观的重要组成部分。它涉及历史学的许多基本理论问题,因而引起世界史学界的长期争论与探讨,对世界各国、包括我国史学界都有着深
在工商企业科学化管理运动的推动下,20世纪初,美国地方、州和联邦等各级政府都把追求"效率"作为政府管理与改革的主要目标。在公共行政管理科学化的过程中,20世纪上半叶,逐渐
在中国现代文学史上,张爱玲的作品具有不可替代的地位。现实社会中,女性在父权架构中处于从属地位,这种作为男性附属物的生存现状,引起了张爱玲的关注,并且对女性的命运进行
研究了具有参数摄动、外界干扰等不确定因素影响的线性组合系统的模型跟踪控制问题·考虑到互联项在组合系统中不可忽视的重要作用,提出了一种参考模型选择的新思路:在选择参