【摘 要】
:
为了提高支持向量机(Support Vector Machine, SVM)在大类别数目海量样本中的学习和分类性能,本文对有效地解决多层文本分类和增量学习等方面的问题进行了研究。论文首先对适
论文部分内容阅读
为了提高支持向量机(Support Vector Machine, SVM)在大类别数目海量样本中的学习和分类性能,本文对有效地解决多层文本分类和增量学习等方面的问题进行了研究。论文首先对适用于大类别数目的多层文本分类方法进行了研究,提出并解决了支持向量机多层分类训练样本集、关键特征项表和分类器的构建问题。其次在多层文本分类的基础上设计了一种能够有效解决海量样本学习的支持向量机增量学习方法HISVML,该方法包括分类树增量更新和特征集增量更新两部分内容。分类树增量更新是根据新增样本违背KKT条件路径进行在线增量学习;特征集增量更新是在增量更新分类树之前进行关键特征项的批量增量学习调整。最后,论文给出了一个基于C++,结合了多层文本分类和HISVML方法的支持向量机文本分类系统RCCata。实验表明,RCCata多层分类较传统单层分类具有较高的分类准确性和较快的分类速度;RCCata增量学习较一次性学习在具有近似分类准确率的同时,耗用的内存较少。
其他文献
随着网络技术的迅速发展,在任何时候、任何地点接入信息网获得所需信息成为21世纪人类的普遍要求,移动计算技术使这种需求得以实现。由于移动计算环境与固定计算环境的差异,
随着网络技术的不断发展,网络应用不断丰富起来,从静态文件、图片的获取发展到动态多媒体文件的获取,尤其以高清晰的视频文件的下载占有很大比例,但是用户需要花费大量时间等
随着计算机和网络的快速发展,越来越多的嵌入式设备接入了互联网,嵌入式系统网络化程度的不断提高,其安全问题显得越来越重要。提高系统的安全性和可靠性是未来嵌入式系统的
可重构处理器是通用处理器与专用处理器的折中,同时具有通用处理器的灵活性与专用处理器的高能效。相比于细粒度可重构处理器FPGA,粗粒度动态可重构处理器(Coarse-grained Re
近些年来,计算机网络所面临的安全威胁越发引人关注。传统的入侵检测系统有较高的误报、漏报率,并且,对未知类型攻击不能很好的识别。虽然之后提出了入侵防御系统的概念,但是
电力工业的市场化改革正在全世界范围内展开,我国正处在“厂网分开,竞价上网”这一改革过程之中。由于电力需求以及电价的不确定性,发电商如何投标来最大化自己的利润,同时降低风
计算机的普及和网络的发展改变了教学模式,尤其是教学资源数字化、网络化成为一个必然的趋势。在这样的趋势下,产生了大量的教学资源,不仅包括传统的物理资源,还包括数字化的
随着现代网络的飞速发展,传统互联网络Internet和各种无线网络之间逐渐形成了互融共存的局面,其中包括无线Mesh网WMN,无线局域网WLAN、WiMAX、Wi-Fi,无线个域网WPAN,无线传感
数据挖掘是利用分析工具从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中、事先未知、但又潜在有用的信息和知识。数据分类是数据挖掘的重要内容之一,