基于主动半监督极限学习机多类图像分类方法研究

来源 :东南大学 | 被引量 : 2次 | 上传用户:yhbx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类是根据图像中反映出来的各自特性,把属于不同类别的图像分类出来的图像处理方法。传统的监督式图像分类算法要求先对所有样本进行标记后,再训练得到分类模型。如今,随着信息社会的快速发展,可获取数据的量级也在不断增大,但为海量的样本进行手工标注则往往需要耗费大量的人力、物力与财力。基于此,本文拟结合主动学习(分类模型质量提升快)与半监督学习(无需手工标注)的优点提出相应的多类图像分类算法,以最大限度利用未标记样本的隐含信息提高分类性能。此外,考虑对海量数据建模的实时性问题,本文不再采用传统的速度较慢的支持向量机,改用基于单隐层前馈神经网络的极限学习机(Extreme Learning Machine, ELM)构造分类模型。相比传统的神经网络学习算法,ELM更简单,且其所有隐层结点上的参数均无需调整,而是随机生成,具有处理速度快,泛化性能强等优点,适用于本文所要处理的海量图像多类分类问题。本文围绕主动半监督极限学习机多类图像分类问题展开研究,主要研究内容包括:(1)图像预处理与分类器建模研究。采用词袋统计模型对图像进行预处理,从图像中提取SIFT特征,并对特征进行K-means聚类得到视觉单词本,再采用向量量化特征编码得到其词频统计直方图,进而得到图像的特征描述,并以该特征向量训练ELM分类模型。(2)结合最优-次优标记(Best Versus Second Best, BVSB)主动学习与基于距离度量的自训练半监督学习的极限学习机算法及其在多类图像分类任务上的应用研究。首先,考虑到上述两类学习算法均需对未标记样本的不确定性进行度量,故在理论分析的基础上,采用非线性变换的方法将ELM在输出节点上的实际输出值转换为近似后验概率表示,进而结合BVSB主动学习算法和基于最近邻度量的自训练半监督学习算法,提出一种适用于多类图像分类的主动半监督极限学习机算法,以保证在手工标注的训练样本尽可能少的基础上,使分类模型的性能得到快速的提升。(3)结合BVSB主动学习与基于流形正则化全局半监督学习的极限学习机算法及其在多类图像分类任务上的应用研究。考虑到前述算法在采用半监督学习时只用到了未标注样本的局部信息,故拟对其进行改进,在每轮主动学习完成后,利用剩余未标注样本的全局信息来进行半监督学习,以进一步提升分类模型质量的改善速率。
其他文献
“人之患在好为人师”,我也特烦教导别人。一来是认为每个人的情况不一样,很难一概论之。那些号称他的成功可以复制的,不是为了骗你钱买书的,就是教你抄袭造假骗人的。二来我光讲、你光听,基本没用。我好好讲《易筋经》,你好好听,你还是不会少林武功。所以,你们想听我讲,刚入职场应该注意什么,让我为难了,想来想去,还是说说好习惯。在江湖上混,养成好习惯第一,其他就在你们各自的特质和造化了。  第一个习惯是及时。
全向视觉是机器人视觉、模式识别的研究热点。全向视觉具有观察范围广、感知信息丰富的特点,与传统的单视角摄像机相比,更适合足球机器人对环境观测的需求,已经逐渐成为机器
网络教学平台,是基于校园网的网络化教学环境,集通知发布、课程信息查询、多媒体视频点播、移动教育、网络教学环境于一身的教学支持综合系统。[1]网络教学平台是伴随着计算机技术和网络技术的发展和应用而生的。网络教学平台由于网络技术的介入,因而给教学活动带来了先进的教学理念、先进的教学方法,为学生的学习活动带来了海量的信息和知识,也提供了一个全新的交互灵活的学习环境。如何有效地利用这一先进教学手段来改进行
广义预测控制(GPC)作为一种新型的预测控制算法,主要成果都是以线性系统为被控对象,在理论和应用上都有较好的研究成果。本文首先对广义预测控制理论(GPC)进行了系统的介绍,从它的基本原理出发,对其算法过程和所具有的特性都给予了讨论,还更进一步的探讨了改进的广义预测控制算法。虽然广义预测控制(GPC)算法具有模型参数少、鲁棒性强、控制效果好等特点,但对于强非线性的系统,由于很难得到精确的模型,用这种
随着机器人技术和网络技术的发展,网络遥操作机器人日益受到关注,成为研究的热点,它应用于危险环境下的远程作业、太空探索、远程医疗以及远程教育等众多方面,具有广阔的应用
研制智能下肢假肢目的是为了改善残疾人生活质量及促进医疗福利事业的发展,同时智能下肢假肢也是近年来机器人学与生物医学工程领域广受关注的研究方向。目前国外已经出现智
视觉监控中的多物体跟踪是计算机视觉研究领域的热点问题之一,尤其是近年来,视频监控系统发挥着越来越重要的作用,它广泛应用于民宅、停车场、公共场合、银行等一些场所的实