基于局部敏感哈希和支持向量机的半监督增量学习研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:jueduizone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机网络技术和传感器技术的发展,应用软件和设备产生了大量的高维数据,且规模呈几何级数增加。这些数据大多数是无标签样本或是带少量标签的样本,而给大量样本加标签是非常困难的。同时半监督式增量学习作为机器学习中的重要研究方向,对整个信息时代的发展都有着非常重要地意义。因此本文在研究传统机器学习算法的基础上,着重研究了基于支持向量机半监督增量学习。本文主要工作和成果如下:(1)查阅了大量国内外参考文献,讨论了现阶段半监督学和增量学习的研究进展,阐述了目前机器算法无法很好地适应复杂环境的现状,并对机器学习、半监督学习、支持向量机理论以及局部敏感哈希理论思想做了简要分析,为下文将要展开的研究做好理论基础。(2)分析了几种常用增量学习的不足,提出了一种基于局部敏感哈希的SVM增量学习方法。算法首先利用局部敏感哈希能快速查找相似数据的特性,在SVM算法的基础上,筛选出增量中可能成为SV的样本,然后与已有SV一起作为后续训练的基础。最后多个数据集的实验结果表明该算法能有效地提高训练学习的速度,并能保持有效的准确率。(3)在对半监督学习尤其是TSVM进行分析基础上,提出基于PCA-LSH的TSVM增量学习算法。算法筛选出第一次增量中与有标签样本相似的样本,通过TSVM得到SV,并筛选出再次增量中有可能成为SV的无标记样本,然后与已有SV和有标签样本一起作为后续半监督增量训练的基础。最后进行实验仿真,实验结果表明该算法提高了训练速度和分类精度,尤其在样本中带标签样本比重较小时具有极好的适应性。(4)最后,将本文提出的学习算法与实际应用相结合,验证了本文算法在实际应用中也有其有效性。
其他文献
随着无线通信技术和移动互联网的高速发展,用户对于高速率、高质量的无线通信业务的需求以惊人的速度猛增。但现有蜂窝移动通信系统已经无法满足用户的要求。因此,为用户的语
随着微电子科技的不断发展,无线传感器网络(WSN)在军事、医疗、农业和工业等各个方面都得到了广泛的应用。WSN中的传感器节点利用能源有限的电池进行供电,这大大限制了 WSN的
学位
关键词拍卖作为近十几年发展起来的一种重要的广告服务形式,是Google、Bing、百度等互联网企业主要的盈利模式。学者们大多从关键词拍卖的均衡分析、关键词拍卖的机制设计、
随着网络技术的飞速发展,互联网成为人们获取新闻信息的重要渠道。然而,互联网中新闻信息杂乱无序、关联不足、碎片化特征明显,导致人们无法深入地了解新闻事件,对事件的认识
我国的产业地产在最近的二十多年里经历了巨大的发展。其相对传统地产而言,最大的挑战是开发回报周期较长,开发前期和中期需要大量的资金投入。因此,寻找合理的融资模式对于
目前,Internet所提供的服务从最初的通信到现在流行的信息载体,涉及的业务范围越来越广,无论是浏览新闻还是商品交易,大都是通过互联网来完成,网络承载了十分庞大的用户信息
人脸检测属于目标检测算法,是指在图像中检测出人脸位置并给出其坐标,人脸矫正属于关键点检测算法,是指在人脸图像上标定出人脸局部关键点坐标。通过人脸检测与矫正技术,可以
入侵检测技术是网络安全的一个重要环节,无论是哪种网络安全的需求,发现当前网络中出现的入侵行为是十分重要的,这些是制定实施安全策略的前提,因此高效的入侵检测技术是必不
在链接数据中,对象的类型信息对于链接数据的挖掘与利用具有非常重要的价值。然而对象类型缺失问题在链接数据中普遍存在。如何确定对象缺失的类型成为数据科学领域亟待解决