基于粗糙集和遗传算法的文本分类研究

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:zengbiao2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动文本分类是数据挖掘和知识发现的关键一步。标准的机器学习技术(如SVM等)已经成功地应用于文本分类。但是,高维度的特征向量影响了分类速度和核函数的设置以及特征的选择则影响了分类的精度。本文提出了降低特征向量的维度和优化SVM参数来提高SVM分类的精度和速度。为了提高分类的速度和精度,本文提出了使用粗糙集对特征向量进行降维,使用遗传算法对特征选择和SVM参数进行优化。实验表明基于粗糙集和遗传算法的SVM分类方法比传统的k-NN和决策树方法更有效率。
其他文献
随着家庭经营承包责任制的兴起,农村涌现了一批专业服务组织。它们在为农业产前、产中、产后的服务上发挥了积极的作用。据武昌县的统计,去年发展起来的各种专业服务组织就达47
经济责任制是从我国国情和企业现状出发,总结和继承我国企业管理中一些好的做法,吸取国外企业管理的有益经验,建立起来的一套企业管理制度。它在工业企业推行以来,已经使工业企业
蔬菜污染主要来自生产中的农药污染。对普洱市无公害蔬菜生产中污染来源、污染原因、存在的问题等进行了调查研究,并就如何解决普洱市无公害蔬菜生产过程中农药污染问题提出
NAT技术是IETF提出的有效解决IPv4面临的网络地址枯竭问题的方案之一。由于传统的基于GP-CPU或ASIC的NAPT处理复杂、负荷过重而造成性能瓶颈,本文提出了一种基于可编程网络处
从2006年3月1日起,在全国范围内发布的公安部第85号令《保安培训机构管理办法》开始正式执行,这也就意味着我国保安发展进入了一个新的阶段,也意味着我国政府对保安业发展将
“光电效应”是光的粒子性的一个重要体现,学习中要澄清一些易混淆的概念,如“光子”、“光电子”、“光子的能量”与“光电子的最大初动能”等,这对理解光电效应的规律具有重要
本文论述和设计了基于新型MCU的智能流量监控系统。本着小型化、智能化的原则,设计中采用Philips公司带下载功能的高性能P89C51RD2单片机作为控制核心;设计了LED并配以小键盘构成的便捷人机对话接口;辅以打印输出、数据存储、开关量输出;系统采用AC-DC电源模块为系统供电;构成高精度数据采集处理平台。
研究了不同有效钾用量对甘薯生长、产量及品质的影响。试验设4个有效钾水平(0,150,300,450 kg/hm2),0 kg/hm2为对照,选用4个甘薯品种为试验对象,在其生长期分别对各品种主蔓长
中国近代史是中国通史的一个重要组成部分。它是研究中国近代社会历史的一门科学。学习中国近代史可以使我们受到生动而具体的爱国主义和历史唯物主义的教育,懂得历史发展的客
马铃薯是一种分布广,容易栽培的宜粮、宜饲、宜作多种工业原料,具备多功能用途的农作物,其丰富的营养价值深受广大群众的喜爱。过去,腾冲县每年都种植冬马铃薯,但产量较低,经