基于稀疏编码技术和极限学习机的场景识别

来源 :福州大学 | 被引量 : 1次 | 上传用户:songfenhao3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景识别是通过图像处理技术与模式识别技术来辨认出图像所属的场景。场景识别是计算机视觉和机器人领域中重要的研究之一,促进了图像检索技术和智能机器人导航等应用的发展。场景识别主要由特征提取和分类器识别两个模块组成。本论文分别对图像特征提取和识别算法进行研究,提出了两种不同的特征提取算法,并采用极限学习机(Extreme learning machine,ELM)算法进行识别。本论文的主要研究内容及贡献如下:在特征提取模块中,本论文提出了两种不同的特征提取算法,第一种是基于稀疏编码技术的中层特征提取算法。基于稀疏编码技术的特征提取算法包括使用Dense SIFT(Dense Scale-invariant feature transform,Dense SIFT)进行底层特征提取、稀疏编码和空间池化三个步骤。Dense SIFT对旋转、亮度变化具备不变性,而且对视角变化、仿射变换、噪声也具备一定程度的稳定性,提高了场景特征表达的鲁棒性。稀疏编码可以实现对数据的稀疏表示,从而提高特征表达的辨别能力。本论文不仅采用基于L1范数的feature-sign搜索算法,还提出了基于L0范数的同伦迭代硬阈值方法(Homotopy iterative hard thresholding method,HIHT)编码。空间池化过程对图像划分区域,并分别统计区域内的中层特征,可防止空间分布信息的损失。在空间池化过程,根据场景图像在水平方向和垂直方向具有明显的层次划分的空间布局的形式,本论文提出一种矩形1*1、1*4、4*1组合而成的空间布局划分方式。本论文所提的第二种特征提取算法是基于卷积神经网络的特征提取算法。经过基于BP算法的监督式学习,卷积神经网络可以自动地学习到具有稀疏性、多层次的特征表达。在分类器识别模块,针对场景图像分类边界高度非线性化的问题,本论文使用基于核函数的ELM进行场景识别,可获得较好的识别性能。本论文将上述提出的场景识别方法在15类场景数据库中进行了验证。实验结果表明,将两种特征提取方法结合ELM进行场景识别分别达到86.23%和88.38%的识别精度。第一种基于稀疏编码技术的特征提取算法,提取过程简单,可直接获得中层特征表达。第二种基于卷积神经网络的特征提取算法,网络模型复杂,需要多次重复训练来找到较好的一组网络参数。实验结果表明,采用ELM分类器进行场景识别比采用其他分类器具有更高的识别精度,本论文提出的场景识别方法比其他的场景识别方法具有更好的识别性能。
其他文献
在传统的线性信号处理领域,高斯噪声假设有着很强的理论依据,尽管如此,但它并不适用于脉冲噪声环境下的建模,即不能够描述可能产生大量数据突变的分布。取而代之的是具有更长
随着互联网技术的发展,中国各级政府机构以及事业单位推出了网上办事服务以此提高业务办理效率。在经济全球化的今天,条码技术在物品编码上的应用使商品条码成为流通于国际市
为了让计算机能够更好地理解客观世界中物体的行为,获取物体在客观世界中三维坐标、运动轨迹及速度等运动信息至关重要。基于双目视觉来获取物体空间三维信息的方法,具有非接
随着信息科技的迅猛发展,云制造这种新型的制造模式悄然产生。它是在综合国内制造产业的发展水平和工业生产、工业技术飞速发展以及在中国制造业信息化等发展背景的前提下提
船级社自设立至今已200多年,以自身的专业技术和知识为船东提供船舶检测和维护服务,在保证船舶航行安全中扮演着不可或缺的角色。从诉讼实际情况看,请求法院判决船级社承担损
首先分析了国外轴向柱塞泵在线监测系统功能和特点,然后对轴向柱塞泵故障诊断与寿命预测技术的研制流程进行全面分析,主要包括故障模式与机理分析、监测参数选取方法、故障模
针对PageRank算法仅依靠网页之间的链接结构关系排序,造成平均分配网页权值、主题漂移、偏重旧网页等问题,本文提出一种基于多特征因子融合的网页排序算法。该算法通过增加权
本文使用A股上市公司2006-2015年的数据,实证分析了企业核心业务、机会性业务与企业创新投入的关系,得出以下结论:核心业务利润贡献率与企业的创新投入呈显著的倒U型关系,当
在PaaS云平台数据中心,用户向云平台提交的应用程序需要由虚拟机(VM)来运行,以满足租户应用(Guest Application)之间的隔离需求。虚拟机、或称为客户机(Guest),由物理机(Phys
随着无线通信网络的发展,无线体域网技术得到了社会各个领域的关注。无线体域网可以被用于很多领域,尤其是医疗领域。无线体域网包括三部分,人体附近的传感器节点,中央控制系