论文部分内容阅读
[摘 要]图像识别技术正在高速发展,为了让盲人能够看到“图片”,我们将图像识别技术应用于手机,经过特征提取算法来获得图像特征,将其转化为盲人可以识别的信号,让盲人可以顺畅地使用手机,本文对其应用展开探讨,为其进一步发展提供了创新的思路。
[关键词]图像识别;盲人手机;应用
中图分类号:TU198 文献标识码:A 文章编号:1009-914X(2018)28-0247-01
1 引言
智能设备的发展,使得我们有了很多以前从未有过的感知世界的方式。而对于残障人士来说,这些新技术就像传播学大师麦克卢汉所言,成为他们“人体的延伸”,帮助他们过上更加便利的生活。我们希望通过图像识别的方式,让视力受损的用户能够更方便地“看”到这个世界。
2 图像识别技术概述
2.1 SIFT技术
对图像变化保持稳定的特征描述符称为不变量,比如对图像的旋转保持稳定的不变量称为旋转不变量,对尺度缩放保持稳定的不变量则称为尺度不变量。SIFT 特征对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性。SIFT 算法的实质是检测图像的局部特征-SIFT 特征点,然后根据匹配目标的需要进行特征的组合、变换,以形成易于匹配、稳定性好的特征向量—SIFT 描述子,从而把图像匹配问题转化为SIFT描述子的匹配问题。SIFT特征提取方法是通过强化学习,来对传统的特征提取进行优化,然后可以有效的解决离散系统和非线性系统中出现的问题,主要包括特征迭代和值迭代两种形式,特征迭代主要是通过特征评价与改进的方法,对每一步的特征进行评估,来不断的寻找优化的特征,同时对其进行改良和优化,得到新的权值,生成新的优化函数进行计算,在这个过程当中,评估和改进是循环进行的,最后将会得到一个最优的特征。但是需要注意的是,在最好的运行模式下,相关的一些外部参数条件应当是稳定的,这是非常重要的,如果没有这个条件,就会导致整个特征评估,出现一些意外的情况。值迭代的算法主要是针对于一些方程式的计算,通过最优函数的寻找与控制计算,就能计算出最优的值,它不需要进行控制特征的稳定化,在我们的使用当中必须要注意,无论是迭代特征还是值迭代,都需要对于被控对象的相关特性,尤其是内部特性进行研究,这也是SIFT特征提取的核心特点。
2.2 Brief技术
Brief的特征提取算法步骤为:(1) 给定一副图。(2) 对图像做平滑处理。平滑处理,也就是高斯滤波,也就是blur operation,降低圖像噪声。平滑处理在BRIEF中很重要。(3) 在图像上,选择一个局部块区patch,用表示,它的大小是SxS像素,在p上面提取BREIF特征。一个BRIEF特征,就是若干个测试组成的字节(bit)串。构造特定的[x,y]对,做测试,就得到了BRIEF特征。 Brief特征提取的构建模型是极为复杂的,通过中间层可以对于优化函数进行逼近,在对于图像识别配准进行最优化计算时采用的是单隐层的Brief特征提取网络,同时选择双极性的转移函数来进行计算,这样有利于将内部的关系进行提炼,权值的调整速度也会更快,这样就使得整个系统的数量速度变快,响应速度较高,但是对于节点数要进行控制,如果节点数过少的话,就可能会导致系统的信息分析能力较差,无法对于样本中的规律进行有效的提取,就会导致读取失败,如果节点足够多的话,就很可能会导致整个系统的收敛速度较慢,引起系统出现自身的稳定性误差,造成严重的干扰,所以我们应当综合性的进行评估,选取合适的节点数。Brief是以特征提取系统来进行操作的计算机运行模式,是面向操作层的,是特征提取初级阶段的产物,主要是进行数据运算而不是管理。能够快速的进行特征提取的高度集中和统一处理,重要标志是在其中有一个非常庞大的中央数据库,它可以进行分布式处理,对于快速性的识别,有着极为关键的作用。
2.3 ORB技术
ORB算法其实就是在FAST算法加上BRIEF算法的基础上得到的,因此,我们在这里只需要了解到ORB算法的实现步骤即可。1.给定一幅图,先用oFAST算法,检测关键点的位置。所谓oFAST,就是orientation的FAST,增加了计算关键点的角点方向。2.对这个图,用FAST算法,找出关键点的位置。3.对于关键点,用Harris角点检测,选取前N个最好的点。4.如果处理的图像是多尺度图像,我们需要对每个图都进行处理。5.对于每个角点,根据Intensity Centroid算法,计算角点的方向。通过SIFT和ORB的方法,都可以对于自适应的特征提取模式进行求解,同时它们应该通过对象的一些基本特性,来对其进行优化,得到一个符合实际的答案,其中SIFT主要是通过方程计算来进行最优化的,在得到最优化的结果之前,每一步可能只是部分的稳定,但并不一定是全局化的稳定,所以求出的答案也不一定是总体的优化方案,但是对于ORB来说,它主要是采用每一步特征提取优化的方式来进行最优化特征提取的,所以,在刚开始就对系统有一定的要求,自适应的特征提取,主要是在初始条件稳定的情况下,对于每一步的代价函数来进行计算,在这个算法进行计算的过程当中,对于初始条件进行选择是极为重要的,它对于整个算法能否在较短时间内得到正确的答案,收敛到稳定的区域内是起着关键性的作用的,因此这个算法主要困难在于需要在一开始就找到一个稳定的特征提取模式。
3 图像识别技术在盲人手机中的应用
3.1 数据处理
当一个图像识别模型在进行作用之后,可能会受到环境的影响,同时对于自身的评判体制造成一定的影响与反馈,同时利用设定好的函数结构或神经网络,就可以对执行函数和平方函数之间的误差来进行计算,实现最终的误差减少逐渐逼近,如果是先进行判断后执行的话,就需要使得评判函数最小,主要是通过贝尔曼的优化原因来进行的,这样可以尽量的减少系统的计算时间,同时对于系统的不确定的变化进行有效的响应,对于一些权重与参数可以有效的进行调整,本文利用图像识别函数的神经网络优化,最终得到了图像识别结果,这样就完成了一个控制执行和评判的过程。
3.2 信号转化
图像信号需要数字化处理,就必然存在从模拟图像信号到数字图像信号的转换。由奈奎斯特采样定理可知,采样频率至少是信号最高频率的两倍时,信号才能得到全部重建,否则会引起信号频谱的混叠。而图像信号相较于音频信号,其高频信息更为丰富,所占的频谱带宽更宽,模拟图像信号的数字化对硬件的采样率提出了更高的要求。
4 总结
我们利用图像识别技术来对于盲人的手机进行改造,有利于提升其整体工作性能,使得其信号传送的问题得到解决,可以把图像信号传送给盲人,这对于我国手机行业发展来说有着极为关键的意义。
参考文献
[1]胡娟. 基于超声波与图像识别的盲人导航眼镜研究与实现[D].电子科技大学,2016.
[2]于红利. 盲人导行辅助系统中信息采集及优化研究[D].南华大学,2013.
[3]喻正红. 基于嵌入式系统的盲人图标识别研究[D].湘潭大学,2009.
[关键词]图像识别;盲人手机;应用
中图分类号:TU198 文献标识码:A 文章编号:1009-914X(2018)28-0247-01
1 引言
智能设备的发展,使得我们有了很多以前从未有过的感知世界的方式。而对于残障人士来说,这些新技术就像传播学大师麦克卢汉所言,成为他们“人体的延伸”,帮助他们过上更加便利的生活。我们希望通过图像识别的方式,让视力受损的用户能够更方便地“看”到这个世界。
2 图像识别技术概述
2.1 SIFT技术
对图像变化保持稳定的特征描述符称为不变量,比如对图像的旋转保持稳定的不变量称为旋转不变量,对尺度缩放保持稳定的不变量则称为尺度不变量。SIFT 特征对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性。SIFT 算法的实质是检测图像的局部特征-SIFT 特征点,然后根据匹配目标的需要进行特征的组合、变换,以形成易于匹配、稳定性好的特征向量—SIFT 描述子,从而把图像匹配问题转化为SIFT描述子的匹配问题。SIFT特征提取方法是通过强化学习,来对传统的特征提取进行优化,然后可以有效的解决离散系统和非线性系统中出现的问题,主要包括特征迭代和值迭代两种形式,特征迭代主要是通过特征评价与改进的方法,对每一步的特征进行评估,来不断的寻找优化的特征,同时对其进行改良和优化,得到新的权值,生成新的优化函数进行计算,在这个过程当中,评估和改进是循环进行的,最后将会得到一个最优的特征。但是需要注意的是,在最好的运行模式下,相关的一些外部参数条件应当是稳定的,这是非常重要的,如果没有这个条件,就会导致整个特征评估,出现一些意外的情况。值迭代的算法主要是针对于一些方程式的计算,通过最优函数的寻找与控制计算,就能计算出最优的值,它不需要进行控制特征的稳定化,在我们的使用当中必须要注意,无论是迭代特征还是值迭代,都需要对于被控对象的相关特性,尤其是内部特性进行研究,这也是SIFT特征提取的核心特点。
2.2 Brief技术
Brief的特征提取算法步骤为:(1) 给定一副图。(2) 对图像做平滑处理。平滑处理,也就是高斯滤波,也就是blur operation,降低圖像噪声。平滑处理在BRIEF中很重要。(3) 在图像上,选择一个局部块区patch,用表示,它的大小是SxS像素,在p上面提取BREIF特征。一个BRIEF特征,就是若干个测试组成的字节(bit)串。构造特定的[x,y]对,做测试,就得到了BRIEF特征。 Brief特征提取的构建模型是极为复杂的,通过中间层可以对于优化函数进行逼近,在对于图像识别配准进行最优化计算时采用的是单隐层的Brief特征提取网络,同时选择双极性的转移函数来进行计算,这样有利于将内部的关系进行提炼,权值的调整速度也会更快,这样就使得整个系统的数量速度变快,响应速度较高,但是对于节点数要进行控制,如果节点数过少的话,就可能会导致系统的信息分析能力较差,无法对于样本中的规律进行有效的提取,就会导致读取失败,如果节点足够多的话,就很可能会导致整个系统的收敛速度较慢,引起系统出现自身的稳定性误差,造成严重的干扰,所以我们应当综合性的进行评估,选取合适的节点数。Brief是以特征提取系统来进行操作的计算机运行模式,是面向操作层的,是特征提取初级阶段的产物,主要是进行数据运算而不是管理。能够快速的进行特征提取的高度集中和统一处理,重要标志是在其中有一个非常庞大的中央数据库,它可以进行分布式处理,对于快速性的识别,有着极为关键的作用。
2.3 ORB技术
ORB算法其实就是在FAST算法加上BRIEF算法的基础上得到的,因此,我们在这里只需要了解到ORB算法的实现步骤即可。1.给定一幅图,先用oFAST算法,检测关键点的位置。所谓oFAST,就是orientation的FAST,增加了计算关键点的角点方向。2.对这个图,用FAST算法,找出关键点的位置。3.对于关键点,用Harris角点检测,选取前N个最好的点。4.如果处理的图像是多尺度图像,我们需要对每个图都进行处理。5.对于每个角点,根据Intensity Centroid算法,计算角点的方向。通过SIFT和ORB的方法,都可以对于自适应的特征提取模式进行求解,同时它们应该通过对象的一些基本特性,来对其进行优化,得到一个符合实际的答案,其中SIFT主要是通过方程计算来进行最优化的,在得到最优化的结果之前,每一步可能只是部分的稳定,但并不一定是全局化的稳定,所以求出的答案也不一定是总体的优化方案,但是对于ORB来说,它主要是采用每一步特征提取优化的方式来进行最优化特征提取的,所以,在刚开始就对系统有一定的要求,自适应的特征提取,主要是在初始条件稳定的情况下,对于每一步的代价函数来进行计算,在这个算法进行计算的过程当中,对于初始条件进行选择是极为重要的,它对于整个算法能否在较短时间内得到正确的答案,收敛到稳定的区域内是起着关键性的作用的,因此这个算法主要困难在于需要在一开始就找到一个稳定的特征提取模式。
3 图像识别技术在盲人手机中的应用
3.1 数据处理
当一个图像识别模型在进行作用之后,可能会受到环境的影响,同时对于自身的评判体制造成一定的影响与反馈,同时利用设定好的函数结构或神经网络,就可以对执行函数和平方函数之间的误差来进行计算,实现最终的误差减少逐渐逼近,如果是先进行判断后执行的话,就需要使得评判函数最小,主要是通过贝尔曼的优化原因来进行的,这样可以尽量的减少系统的计算时间,同时对于系统的不确定的变化进行有效的响应,对于一些权重与参数可以有效的进行调整,本文利用图像识别函数的神经网络优化,最终得到了图像识别结果,这样就完成了一个控制执行和评判的过程。
3.2 信号转化
图像信号需要数字化处理,就必然存在从模拟图像信号到数字图像信号的转换。由奈奎斯特采样定理可知,采样频率至少是信号最高频率的两倍时,信号才能得到全部重建,否则会引起信号频谱的混叠。而图像信号相较于音频信号,其高频信息更为丰富,所占的频谱带宽更宽,模拟图像信号的数字化对硬件的采样率提出了更高的要求。
4 总结
我们利用图像识别技术来对于盲人的手机进行改造,有利于提升其整体工作性能,使得其信号传送的问题得到解决,可以把图像信号传送给盲人,这对于我国手机行业发展来说有着极为关键的意义。
参考文献
[1]胡娟. 基于超声波与图像识别的盲人导航眼镜研究与实现[D].电子科技大学,2016.
[2]于红利. 盲人导行辅助系统中信息采集及优化研究[D].南华大学,2013.
[3]喻正红. 基于嵌入式系统的盲人图标识别研究[D].湘潭大学,2009.