【摘 要】
:
21世纪,信息量以几何级数的飞快速度的向上增长。而作为个人,要想从海量的信息中快速、有效的查找我们想要的信息,难度可想而知。在此迫切需求之下,文本自动分类技术应运而生
论文部分内容阅读
21世纪,信息量以几何级数的飞快速度的向上增长。而作为个人,要想从海量的信息中快速、有效的查找我们想要的信息,难度可想而知。在此迫切需求之下,文本自动分类技术应运而生。该技术是基于文本自带的信息进行分类的技术,是由计算机根据建立的模型自动对文本分类的过程。文本分类过程中,面对譬如文本向量稀疏性大、维数高、特征之间具有较大的相关性等问题,SVM都有针对性的解决方法。因此,SVM在文本分类过程的应用中的潜力是无限的,在现实领域中的应用也得到了大力的提倡。正如辩证法中所说的:任何事物都是对立统一的整体。SVM在文本分类中应用也肯定不会是一帆风顺的。现在随着SVM在文本分类中的应用领域不断的扩展和深入,出现了许多至今都尚未解决的新课题。本文就是从降低文本分类过程中文本向量数目、提高分类效率以及准确率等角度出发,来加快建模支持向量机分类的速度。提出了一种改进的基于密度聚类的方法提取训练样本数据集中对分类起决定性作用的支持向量集作为新的训练样本集来进行分类器建模。
其他文献
从20世纪70年代开始,人类逐渐进入信息化社会,互联网正以惊人的速度改变着人们的生活方式和工作效率。而随着分布式计算机网络的广泛使用,网络的安全问题也日益突出。网络安
无线传感器网络是21世纪最重要的技术之一,能够广泛的应用在智能交通、国防军事、环境监测、医疗卫生、空间探索等许多领域。节点自定位技术是无线传感器网络的主要支撑技术
随着VPN的大规模商用,网络结点急剧增多。一些企业中的关键业务,如移动运营商的软件服务,对网络结点可靠性要求很高,如何对整个VPN网络进行合理、高效的管理是当前企业面临的难题
孤子是自然界中一个非常普遍又非常重要的非线性现象,它的形成是线性和非线性效应平衡的结果。光学或电磁孤子在光通信、光计算、全光信息处理等领域具有重要的应用价值。最近
众所周知,MATLAB作为一个高度集成的系统,在其内部所提供的工具箱中集合了许多关于科学计算、图象处理、声音处理等功能,在使用MATLAB进行科学计算的时候具有极高的编程效率
现今Internet已然成为人们获取信息的主要来源,它的快速发展使得信息资源迅速膨胀,文本自动分类作为有效地组织和管理这些信息的关键技术之一有着广泛的应用前景。本文结合东
作为信息隐藏技术的一项重要应用,数字水印为保护多媒体信息的版权及内容的合法使用提供了一种新的解决思路。其中利用脆弱性数字水印技术对多媒体内容进行真伪性和完整性认
随着我国航运业的飞速发展,VTS(Vessel Traffic Service)系统在减少船舶交通事故、提高航运效率方面发挥了重大作用。然而,由于我国VTS工程建设起步晚,现有VTS设备主要由国外
地表温度作为评价和评估地表面平衡的一项重要指标,对其进行研究分析可以让人们更好地认识地表温度的变化规律。因此对地表温度规律及趋势进行研究具有非常重要的意义。但是在
进入21世纪,全球气候变化问题成为世界各国共同关注的焦点,“节能减排”、“固碳减排”等已逐步引起全球的重视。农田土壤有机碳的变化是陆地生态系统影响大气 CO2碳源/汇效应