论文部分内容阅读
随着人工智能时代的到来,计算机视觉领域受到越来越多的研究工作者的重视,目标是能让机器“感知”世界,深度学习技术的兴起在很大程度上推动了该领域的研究工作的进展。深度学习属于机器学习的一个分支领域,在图像检测、识别,场景分析,无人驾驶,语音识别等领域取得了重要成效。每个人的不同表情具有很明显的区分性,但同一个表情在不同的人呈现时会存在很大差异性,从此可以看出,面部表情的识别仍是一个难以解决的问题,面部表情的呈现主要依靠面部不同组件的运动共同完成的,本文提出基于多尺度的全局和局部面部特征对面部表情进行识别。对于每张面部表情图片,首先产生10个切片(根据面部原始图片产生的5个全局区域切片和根据面部关键点产生5个局部区域),每个切片对应3种不同的尺寸大小,将得到的所有切片进行水平翻转,最终每个面部表情图片得到60个切片。为了得到更具有区分性的深度特征,本文通过不断调整卷积神经网络的网络参数组合训练出性能较优的深度模型,最终利用获得的深度特征在LIBSVM上分类。与其他方法相比,本文的实验方法在CK+和JAFFE两个公开数据集上取得了一定的成效。传统的昆虫识别方法主要依靠具有专业知识的昆虫学专家来辨别,这种方法需要大量人力,然而具有昆虫专业知识的昆虫学专家并不多,因此昆虫种类的自动识别显得越来越重要。目前主要基于昆虫形态学和昆虫声音系统,主要由于不同种类的昆虫的形状、纹理和颜色等特征上存在着明显的差异,而且昆虫产生的声音在种类内存在很强的相似性,在种类间存在很大的差异性。本文提出一种新的昆虫识别的方法,利用快速傅里叶变换算法(Fast Fourier Transformation,FFT)将昆虫的声音文件转换成昆虫声音的频谱图像,利用这些频谱图像和卷积神经网络训练出性能较好的深度模型,从而提取出每个昆虫声音文件对应的深度特征,最终使用LIBSVM进行分类实验。本文的识别方法相比于其他方法能够有效提高昆虫识别准确率,为了进一步提高昆虫识别的准确率,本文使用了批规范化操作来保证在网络训练过程数据分布的一致性和减小批量数据分布的影响。本文主要基于深度学习技术对面部表情识别和昆虫识别两个模式识别问题进行了相关研究,有效提高了面部表情识别准确率和昆虫识别准确率,为此后的研究工作做了基础性工作。