基于多特征选择的中文文本分类

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:zhilong217
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动文本分类就是在给定的分类体系下,让计算机根据文本的内容确定与它相关联的类别。特征选择作为文本分类中的关键,困难之一是特征空间的高维性,因此寻求一种有效的特征选择方法,降低特征空间的维数,成为文本分类中的重要问题。在分析已有的文本分类特征选择方法的基础上,实现了一种组合不同特征选择方法的多特征选择方法,应用于KNN文本分类算法,实验表明,多特征选择方法分类效果比单一的特征选择方法分类效果有明显的提高。
其他文献
基于保护私有信息的计算几何问题是安全多方计算的研究热点之一,在军事、商业等领域具有重要的应用前景。研究了几何计算中的最近点对问题,提出保护私有信息的最近点对问题解决方案,在此基础上结合已有的基础协议,设计了一种基于保护私有信息的最近点对协议。对该协议的安全性和复杂度进行了分析。对该问题进行适当的推广,可使之具有更大的实用性。
《国家宝藏2》的前身《国家宝藏》一经播出,便席卷综艺热度榜单,激发了国人对中华优秀传统文化发自内心的热爱,进而在全国引发了一场“博物馆热”,获得了口碑与收视的双赢。
据CSR Europe8月3日消息,意大利国家电网公司近日发布了2015年可持续发展报告,名为“播种能量”,第一次描述和呈现了意大利国家电网公司为完成联合国可持续发展目标(SDGs)所做的努力,目前该公司已经完成了17项目标中的4个。该公司表示,作为行业内领先企业,意大利国家电网公司有责任承担降低能源功率以及让地球更加可持续的挑战。
美国权威媒体《新闻周刊》日前发布“2016年度绿色排行榜”。,作为全球最具公信力的环境影响力排名之一,《新闻周刊》每年都对全球及全美前500大上市企业的可持续发展实践加以严格审慎的评估。  “年度全球绿色排行榜”对各个公司的公开数据进行分析,主要根据八个关键指标作出评比,包括能源生产力、温室气体排放率、水量产生率、废物回收率、绿色收入评分、绿色支付系统、可持续发展委员会及环保审计标准。此次榜单中,
在全媒体时代下,广播节目主持人的角色不断延伸,不仅需要“出声”,还需要“上镜”,同时需要主持人把关的内容越来越多,节目中的信息由单向传播变为交互传播。面对全媒体的挑
快速高效的应对源于责任决策和责任实施的双重准备,确定“风雨彩虹”行动议题后,国网山东电力将社会责任理念融入决策管理全过程,确保决策科学、实施有效。  2013年8月,一场罕见的飑线风灾害袭击了山东中北部地区,造成4市12个县(区)130多万人受灾,部分地区树木、农作物及民房受灾严重,电力设施严重受损,约31万户客户供电中断,成为当年入夏以来最为严重的一次自然灾害。  面对这些突如其来的挑战,国网山
Web应用程序可以分为表示层、业务层、持久层和领域模型层。按照这种分层结构,分别介绍了Tapestry,Spring和Hibernate三种开源框架。Tapestry使得程序具有一致性的结构,通过开发
如今有相当一部分国企、民企、跨国公司的社会责任管理、策划和执行,基本上都放在新闻宣传、品牌管理或公关部门。尤其是跨国公司偏爱设在公共关系、政府公共事务等部门。这意味着现在的企业社会责任议程基本上还是以传播为导向的表达框架,绝大多数企业希望能够通过输出信息来表达企业在社会责任方面的立意主张和价值观念。  但是当前,社会责任领域里提到的“沟通”“传播”跟传播学里说的“传播”其实不是一回事。我们现在对“
在新媒体时代,面对技术更迭的挑战和观众更为严格的要求,谈话类节目主持人不能仅拘泥于采访过程中的一问一答之中。适应新的传播环境、具备新时代的新能力,更能为其主持魅力
2013年4月14日至5月4日,天津医科大学护理学院院长及1名教师同赴瑞典延雪平大学健康学院进行为期3周的学术交流活动。延雪平大学(JonkOpinguniversity)成立于1827年,是一所以创新