基于极限学习机的图像标注研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:lwhxtq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今是图像爆炸式增长的时代,急切需要与之相适应的图像管理和检索能力。图像标注不仅可以为普通用户提供与之使用习惯更加符合的以Web图像搜索为代表的图像检索服务,还将为图像数据的组织、索引、管理带来革命性的变化,甚至能够推动图像理解及整个计算机视觉领域的发展。此外,图像标注在商业应用、数字图书馆、军事、生物医学、网络监控、国家安全等方面也有重要的意义。本文首先介绍了图像标注的一些基础知识,包括图像分割,特征提取,标注模型以及评价标准等。图像分割分为固定划分和N-Cut算法,在特征提取方面,介绍了颜色、纹理、形状等特征。评价标准主要是查全率和查准率。本文重点介绍了图像标注的模型,其中三个主要的模型分别是基于分类的图像标注,基于概率模型的图像标注和基于主题的图像标注。前两个模型试图直接寻找图像(或图像区域)与文本标注词之间的关系,而基于主题的图像标注模型则通过引入潜在主题概念建立高层语义与低层视觉特征之间的联系,从而实现自动图像标注。目前,基于机器学习的图像标注方法得到了广泛的应用和发展。其中,学习器模型的选择就显得非常重要了。本文围绕如何提高标注效果和效率展开了研究,并提出一种基于极限学习机(ELM)的图像标注算法。本方法的特征向量采用的是颜色特征、纹理特征以及SIFT特征组成的复合特征向量,能比较全面的反映图像的特征,有效提高了检索的效率。模型训练中,采用ELM算法,因其结构简单、学习速度快,大大缩小了模型训练和标注的时间。随着ELM的发展,理论研究和实践表明,ELM不但可以用于神经网络中,而且在多分类应用中也有不错的性能表现。本文实验结果表明,采用ELM算法不但在时间开销上有着巨大的优势,同时其良好的泛化性能提高了算法的准确性,二者的综合效果使得图像标注的性能得到了有效提升。最后,在本文算法的基础上设计和实现了图像检索演示系统。
其他文献
随着网络对各个领域的渗透,基于Web的网络教育正在日益发展,它作为传统的集中式教学方式的一种补充有着其不可替代的优势,如学习者的学习可以不受时间和地理位置的限制,学习
近年来,Web应用开发已经成为发展最快的一种计算机应用技术,很多计算机应用系统都建立在Web基础之上。J2EE技术的成熟,轻量级开源项目的涌现,为Web应用程序更进一步的发展提
随着国际互联网的迅猛发展,网上文本信息资源以指数级的速度增长。如何快速有效地将文本按其内容进行分门别类的整理,以便于利用这些海量文本,变得越来越重要和困难。因此,研究文
汉字是世界上历史最悠久、使用人口基数最大的一种文字。汉字的书写学习具有一定的难度,特别是对于初学汉字的低龄儿童来讲。传统的汉字书写学习都是在课堂上完成的,老师不能
随着信息技术的迅速发展,信息管理系统不断升级和整合,其中必然要面临数据迁移的问题。针对现有数据迁移工具在数据转换、数据映射关系等方面存在缺陷,研究数据迁移技术,并开
云计算是近年来热度很高的新技术,而用户隐私保护一直是影响云计算推广的重要问题。当前,在对云计算的研究中,已有一些学者提出了不同的用户隐私保护的方案,但是针对云服务提
多智能体协作是多智能体系统MAS研究的核心问题。在复杂、动态、不确定的多智能体环境中,为了满足多智能体协作中对局部配合和通信受限的要求,本文对智能体策略寻优、行为协
图像融合是一门聚合了传感器、信号处理、图像处理、计算机视觉、人工智能等交叉学科的技术手段。性能优异的融合算法能够提取多源信息的兴趣属性、提高图像信息容量、增强特
网络技术的飞速发展和移动计算机的广泛应用,使人们对移动互联网的需求变得十分迫切。这种迫切需求极大地促进了移动IP的研究,其中移动IPv6协议扮演越来越重要的角色。随着移
自计算机产生伊始,对计算机图形和动画的研究就没有停止过。随着影视业在人们生活中发挥着越来越重要的作用,计算机图形学和动画技术在过去的30个年头里得到了惊人的发展。与