基于粗糙集和遗传算法的文本分类研究

来源 :微计算机信息 | 被引量 : 0次 | 上传用户：zengbiao2010

【摘要】

：

自动文本分类是数据挖掘和知识发现的关键一步。标准的机器学习技术（如SVM等）已经成功地应用于文本分类。但是,高维度的特征向量影响了分类速度和核函数的设置以及特征的选择则

【作者】

：

张美虎张建明

【机构】

：

扬州职业大学,江苏大学

【出处】

：

微计算机信息

【发表日期】

：

2009年33期

【关键词】

：

文本分类 SVM 粗糙集遗传算法 Document Classification Support Vector Machine Rough Sets Gene

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自动文本分类是数据挖掘和知识发现的关键一步。标准的机器学习技术（如SVM等）已经成功地应用于文本分类。但是,高维度的特征向量影响了分类速度和核函数的设置以及特征的选择则影响了分类的精度。本文提出了降低特征向量的维度和优化SVM参数来提高SVM分类的精度和速度。为了提高分类的速度和精度,本文提出了使用粗糙集对特征向量进行降维,使用遗传算法对特征选择和SVM参数进行优化。实验表明基于粗糙集和遗传算法的SVM分类方法比传统的k-NN和决策树方法更有效率。

其他文献

农村专业服务组织应向企业化过渡

随着家庭经营承包责任制的兴起，农村涌现了一批专业服务组织。它们在为农业产前、产中、产后的服务上发挥了积极的作用。据武昌县的统计，去年发展起来的各种专业服务组织就达47

期刊

专业服务组织农村企业化经营承包责任制社会化生产行政性商品化农业

经济责任制与目标管理

经济责任制是从我国国情和企业现状出发，总结和继承我国企业管理中一些好的做法，吸取国外企业管理的有益经验，建立起来的一套企业管理制度。它在工业企业推行以来，已经使工业企业

期刊

经济责任制目标管理企业管理制度工业企业企业现状有益经验

普洱市无公害蔬菜生产中农药污染问题的调查研究

蔬菜污染主要来自生产中的农药污染。对普洱市无公害蔬菜生产中污染来源、污染原因、存在的问题等进行了调查研究,并就如何解决普洱市无公害蔬菜生产过程中农药污染问题提出

期刊

无公害蔬菜农药污染调研对策措施

一种新型的NAT系统的实现机制与性能分析

NAT技术是IETF提出的有效解决IPv4面临的网络地址枯竭问题的方案之一。由于传统的基于GP-CPU或ASIC的NAPT处理复杂、负荷过重而造成性能瓶颈,本文提出了一种基于可编程网络处

期刊

网络处理器NATNAPT微引擎周期性能Network Processor（NP） NAT NAPT Microengine Budget Perfo

从人力资源管理的角度解读我国保安培训——兼谈建立我国保安培训体制

从2006年3月1日起,在全国范围内发布的公安部第85号令《保安培训机构管理办法》开始正式执行,这也就意味着我国保安发展进入了一个新的阶段,也意味着我国政府对保安业发展将

期刊

保安培训公安部保安人员保安队伍人力资源管理教育训练工作

针对“光电效应”几个易错概念的例题分析

“光电效应”是光的粒子性的一个重要体现，学习中要澄清一些易混淆的概念，如“光子”、“光电子”、“光子的能量”与“光电子的最大初动能”等，这对理解光电效应的规律具有重要

期刊

光电效应例题分析概念光电子粒子性光子动能

一种基于MCU的智能流量监控系统设计

本文论述和设计了基于新型MCU的智能流量监控系统。本着小型化、智能化的原则,设计中采用Philips公司带下载功能的高性能P89C51RD2单片机作为控制核心;设计了LED并配以小键盘构成的便捷人机对话接口;辅以打印输出、数据存储、开关量输出;系统采用AC-DC电源模块为系统供电;构成高精度数据采集处理平台。

期刊

流量监控MCU测量信号处理Flow Control MCU Measurement Signal Processing

施钾对甘薯生长、产量及品质的影响

研究了不同有效钾用量对甘薯生长、产量及品质的影响。试验设4个有效钾水平（0,150,300,450 kg/hm2）,0 kg/hm2为对照,选用4个甘薯品种为试验对象,在其生长期分别对各品种主蔓长

期刊

甘薯钾肥产量茎叶生长动态主要成分

怎样学习中国近代史？

中国近代史是中国通史的一个重要组成部分。它是研究中国近代社会历史的一门科学。学习中国近代史可以使我们受到生动而具体的爱国主义和历史唯物主义的教育，懂得历史发展的客

期刊

中国近代史学习社会历史历史唯物主义四项基本原则中国通史爱国主义客观规律

腾冲县冬马铃薯规范化高产栽培技术

马铃薯是一种分布广,容易栽培的宜粮、宜饲、宜作多种工业原料,具备多功能用途的农作物,其丰富的营养价值深受广大群众的喜爱。过去,腾冲县每年都种植冬马铃薯,但产量较低,经

期刊

高产栽培技术马铃薯腾冲县多功能用途工业原料营养价值经济效益农作物

基于粗糙集和遗传算法的文本分类研究

与本文相关的学术论文