【摘 要】
:
自动文本分类是根据已经分配好类标签的训练文档集,来对新文档分配类标签。针对模糊kNN算法用于文本分类的性能进行了一系列的实验研究与分析。在中英文两个不同的语料集上,
【机 构】
:
河北理工大学经济管理学院,北京交通大学计算机与信息技术学院
论文部分内容阅读
自动文本分类是根据已经分配好类标签的训练文档集,来对新文档分配类标签。针对模糊kNN算法用于文本分类的性能进行了一系列的实验研究与分析。在中英文两个不同的语料集上,采用四种著名的文本特征选择方法进行特征选择,对改进的模糊kNN方法与经典kNN及目前广泛使用的基于相似度加权的kNN方法进行实验比较。结果表明,在不同的特征选择方法下,该算法均能削弱训练样本分布的不均匀性对分类性能的影响,提高分类精度,并且在一定程度上降低对k值的敏感性。
其他文献
老子文本中充斥着大量的譬喻性和象征性表述,其书写作为一个"譬喻性和象征性交织杂处"的运思过程,譬(隐)喻性和象征性的运用使得"道"之论理以相似性的特征不断延展(所谓"生"),从而达到"
本文通过对所收集的文献资料进行分析总结,筛选整理出旅游资源的定义,并对旅游资源进行分类,首次将政策支持作为一项旅游资源列入分类中.在此基础上,就各项资源的整合问题,笔
在复杂多变的环境中,领导风格对组织绩效有很大影响,对民营物流企业的发展至关重要。构建了领导类型、创业导向和组织绩效的分析框架,对浙南地区的140份研究样本进行实证研究
长期以来,儿童道德教育的内容和方法侧重于例证性思维和抽象道德观念的灌输,其弊端是道德教育疏离于儿童的心理世界,凌驾于儿童的生活世界之上。根据布鲁纳提出的两种思维模
目的 为了解梅毒在本地区发病及临床特点,提高梅毒的诊治水平.方法 对1998年5月至2004年5月间资料完整的206例梅毒进行回顾性分析.结果 男女比例为1.29:1,发病年龄集中在21~40
目的 :通过随机、双盲对照的临床试验 ,探讨卡络磺钠治疗非癌性大咯血 (下称咯血 )的效果。方法 :随机选择 2 5例咯血患者 ,常规予垂体后叶素、镇静、止咳、抗感染治疗 ,同时
综述国内废镁碳砖的回收利用情况,主要介绍了废镁碳砖再生料在中间包、钢包、转炉材料中的应用,比较相关应用的利弊之处,结合我国实际,探讨用后镁碳砖最佳的利用方式。在此基
<正>髓核低温消融技术是近年治疗颈椎病的微创技术之一。我们对2003年11月~2006年6月在我院采用髓核低温消融治疗的颈椎病患者进行了随访观察,报告如下。
心理疏导是诊治孤儿心理问题的关键。“启智”、“释疑”,可提高孤儿的认知水平;激发情感,可满足孤儿的合理需要;因循善诱,可指导孤儿健康交往;以身示范,可培养孤儿正常的人格。
(接上期)三、在国际贸易方面的影响力世界贸易每年增长15%,贸易政策和协议对于制造一个具有“平整场地”的世界市场是至关重要的。然而,单是这些政策不足以确保公平自由地进