基于聚类的增量支持向量机动态构造方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:liongliong436
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高速连续产生数据的数据流使得需要对原始数据集进行多次扫描挖掘的传统方法变得力不从心。如何应用结构简单、具有全局最优、推广能力强且应用最广泛技术之一的支持向量机在数据流上进行高效数据挖掘成为目前的研究热点问题,其自身的计算复杂性成为处理大规模数据时的“瓶颈”问题。本文针对数据流上应用支持向量机进行增量式挖掘这一问题,在分析研究统计学习理论与支持向量机方法的基础上,针对数据流数据挖掘的特点,研究了支持向量机增量学习方法,提出一种基于聚类的增量支持向量机的动态构造方法。该方法利用K-Means聚类分析方法调整增量学习算法中的训练样本集,达到减小同一个样本集中的样本分布差异同时增大不同样本集之间的样本分布差异,使在动态的数据流上数据特性更加明显,从而提高算法的性能。其次,分析了现有分类器融合算法不适合多支持向量机分类器融合的原因,提出一种基于聚类划分的多支持向量机分类器的融合算法,将那些被某些分类器正确分类但被某些分类器错误分类的样本挑选出来单独处理,借鉴C-MCC方法的构造过程,利用聚类的结果对特征空间进行划分,并统计分类器的性能,最后选择在该划分中性能最佳的分类器作为系统的输出。仿真实验的结果表明,本文给出的基于聚类的增量支持向量机动态构造算法在分类性能上要优于传统的w-model增量学习算法,在此基础上提出的基于聚类划分的多支持向量机分类器融合算法在融合精度上优于投票法、K-NN法以及C-MCC等方法。
其他文献
工作流作为一种信息技术,通过提供相应的方法和软件系统,它可以支持一个组织不断改进业务过程以适应需求的快速多变。其主要目标是对业务过程中各步骤发生的先后次序,以及同
电子文档作为现代人们传递信息的一种高效媒体,越来越受到人们的重视。目前世界上流行的电子出版文档格式包括:PostScript、PDF等。文字是一份文档中记录信息的主要形式,所以
井下电视成像系统是一种专门用于获取井下直观图像资料的测井技术,近年来凭借其直观性、准确性和及时性已经成为重要的井下测井技术。目前国外对该技术的研究已经得到广泛应
计算机动画将计算机图形学与动画技术相结合而产生一种用计算机生成连续的具有虚拟真实感画面的技术。随着图形图像技术的不断发展,三维动画技术在影视广告、角色动画、游戏开
本文研究了用Benders分解方法来求解没有建厂费用的两种产品的选址问题.本文首先简单地介绍选址问题及多产品选址问题的一些相关问题,及其线性规划模型。第二章介绍了Benders算法及其背景。第三章用Benders算法具体求算两种产品选址问题。在Benders算法的迭代过程中,关键部分是求一个子问题的对偶最优解,在这里证明了在求解两种产品选址问题时,这个子问题的对偶解很容易求得.最后给出了一个例子,
随着信息技术的飞速发展,无线传感器网络(WirelessSensorNetworks,WSN)正成为传感器领域内一个新兴的研究方向。它集成了传感器、微机电系统和网络三大技术,是一种全新的的信息
无线电广播是一种重要的舆论载体,随着相关技术的发展和普及,对无线电资源的需求越来越大,需要有效的手段对其进行监管,以确保无线电广播的播出安全。无线电广播监测是一个涵
关联规则挖掘是数据挖掘中的重要方法,目前主流的关联规则挖掘算法有Apriori算法、Eclat算法、Fp-growth算法等。上述算法存在如下问题:(1)Apriori算法存在大量I/O操作以及生
防水透湿纺织品是新型高档面料中较重要的一类,近年来发展迅速,广受欢迎。防水性是防水透湿纺织品的重要指标之一,因此研究织物防水性能的自动检测方法是该领域的研究重点之一。
随着Internet和计算机技术的发展,三维模型的应用领域也越来越广泛。由于构建一个高度逼真的三维模型十分费时费力,因此对已有的三维模型进行复用就变得越来越重要。面对庞大