半定规划核在垃圾标签检测中的应用研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:namedmat123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垃圾标签检测是一个二分类问题,可以使用二分类的SVM支持向量机来实现。传统SVM在处理垃圾标签检测上存在以下问题:垃圾标签的训练集规模非常庞大,而且它的数据有高维性、特征复杂等特点,使用传统的SVM直接对垃圾标签数据集进行训练学习,会耗费较长时间,学习精度也受影响。本文提出使用半定规划核对传统的SVM进行改进,主要工作如下:1、使用K-means聚类算法抽取特征向量训练SVM,是提高SVM训练效率的一种方法。垃圾标签数据具有很强的非线性,传统K-means算法的欧氏距离无法有效地处理非线性数据,抽取到的垃圾标签特征向量质量不高。SVM核函数是有较强的非线性映射能力,本文将核函数与K-means聚类算法相结合,提出新算法半定规划核K-means聚类算法,从而提高了K-means算法提取垃圾标签的能力,并通过实验验证新算法的有效性和可行性。2、不同的SVM核函数,其非线性映射特征不同。采用多种核函数组合的方法,是提高SVM分类能力的一个途径。因此本文提出使用半定规划方法来确定多种核函数的最优组合系数,构造半定规划核SVM,提出基于半定规划核的Folksonomy垃圾标签检测算法。实验证明,本文的算法在垃圾标签分类上有很好的效果,不仅提高了分类精度,还能降低训练时间。
其他文献
随着工业的快速发展,实时系统成为了工业领域中一个重要的组成部分,在航空航天、军事、汽车、核工业等一些关键领域中,不仅要实现其系统中的功能,而且要保证其在规定的时间内
为了能够在网络带宽较低或中等的区域实现云备份应用,网络上传输的数据量应越低越好,通过对备份数据使用重复数据删除技术,能够显著降低网络传输数据量。重复数据删除的方法
本文以基于高斯模型的运动目标检测与跟踪为主要研究内容,分别给出了基于高斯背景模型的车辆检测改进算法和基于高斯模型和卡尔曼预测的检测与跟踪。本文主要内容包括以下三个
作为一种重要的蛋白激酶,AMP-activated protein kinase (AMPK)在细胞的能量代谢中发挥着中心控制作用,并有望成为治疗代谢性疾病,如糖尿病、肥胖及代谢综合征的有效靶标。因
测试与测试控制标记版本三(Test and Test Control Notation3rd version,TTCN-3)测试系统的编解码器主要负责TTCN-3数据类型与其他类型通信数据之间的数据格式转换。它是一个
蛋白质在生命活动中拥有着不可替代的功能,对蛋白质的研究也越来越重要。其中蛋白质结构类的预测在蛋白质的很多相关属性的预测中起到了重要的作用,如:蛋白质亚细胞定位、膜蛋白
人脸特征定位是指利用计算机自动的将人脸图像中的各个特征的位置定位出来。人脸特征定位在图像处理领域有着非常重要的作用,能够为人脸识别、表情分析和人脸跟踪的研究提供数
随着信息技术的高速发展,业界较多采用了以集群为代表的分布式并行文件系统来实现海量数据的分布存储及并行处理,应用领域也由计算密集型领域逐渐转向于数据密集型领域,对存储系
随着互联网的发展,互联网中的数据总量也在急剧膨胀,现在已有的传统存储方式已无法满足企业、互联网业务提供商的需要。如此海量的数据促进了企业存储控制成本技术的发展,其中最
物联网的飞速发展使得物联网所面临的安全问题日益引起人们的重视。物联网技术是传感技术,互联网,计算机,无线传感网络等多种相关技术的交融与扩展。然而物联网结构更加复杂,面临