基于深层神经网络的图像识别算法研究

来源 :北京邮电大学 | 被引量 : 29次 | 上传用户:myloft9h
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习算法对于人工智能系统具有重要的理论和实际意义。近十年来,以深层神经网络为代表的深度学习算法和模型在特征选择与学习任务中取得了引人注目的成就,在图像识别、语音识别、机器翻译等多个领域取得了突破性的进展,在部分任务中的数据处理能力甚至超越了人工水平。深层神经网络模型在人工智能应用中表现出了卓越的性能,但是在特征稀疏性、尺度不变性、多通道协变量偏移、频域特征选择能力等方面仍存在一些难以解决的问题。围绕上述技术难题,本文在前人工作的基础上,展开了相关研究,并取得了一些有意义的成果。主要的研究工作和创新点如下:1、对DropConnect算法进行了扩展,改进了掩码生成策略,使得掩码的生成函数依赖于上一层神经元的输出值,从而使得神经网络模型能够根据神经元输出值的稀疏度,动态决定神经元连接的丢弃概率。改进后的模型具有了对稀疏特征进行选择的能力。实验结果表明,新算法输出特征稀疏度大幅提高122.7%以上。此外,识别精度也有一定提高。2、对卷积神经网络模型的尺度不变性进行了研究,提出了一种尺度不变卷积神经网络模型,能够自动适应输入图像在平面空间上的尺度变化。同时,在卷积层中嵌套多层Maxout网络,以进一步提高特征拟合与提取的能力。实验结果表明,相比传统卷积神经网络模型,新模型各层尺度不变性增幅为8.2%—20.1%,识别错误率降幅达13.1%以上。3、为解决多通道神经网络模型中的跨通道协变量偏移问题,将单通道的批量归一化算法推广到了多通道的情况下,提出了一种跨通道批量归一化算法。完整的推导了跨通道批量归一化算法的前向和反向传播过程,并在深度残差模型中进行了实验。实验结果表明,应用新算法以后,训练过程中神经元激活值的分布情况变化的更为稳定,识别错误率降低了 4.0%左右。4、针对卷积神经网络模型频域特征提取能力不足的问题,将频域滤波操作加入到卷积层中,提出了一种具有频域特征选择能力的卷积神经网络模型。新模型加强了对于特定频段信号特征的提取能力,从而提高了识别精度。经实验验证,在GTSRB数据集上,识别错误率从6.69%降至3.17%,效果明显。综上,本文对于深层神经网络的特征稀疏性、尺度不变性等多方面的问题进行研究。所得成果在应用于图像识别任务时,取得了良好的改进效果。
其他文献
目的探讨汽车装配工人工作相关肌肉骨骼疾患(WMSDs)的发生情况及相关不良工效学因素。方法应用经适当修订的《美国危险区域检查表》和《北欧肌肉骨骼疾患调查问卷》形成综合
2016年6月,普京在圣彼得堡国际经济论坛上提出了建立大欧亚伙伴关系的倡议。用层次分析法、对比分析法和文献法对大欧亚伙伴关系提出的原因进行探讨,可以认为俄罗斯和欧亚经
为促进房地产业的转型升级,创建房地产业生态价值链,构建房地产业生态价值链系统的价值增值模型,演化模拟各个价值主体间关系不断演化直至达到协同共生模式的过程,挖掘协同增
中国科学技术信息研究所、日本科学技术振兴机构和韩国科技信息研究院分别是中国、日本、韩国的国家级科技情报机构代表。介绍了3个科技情报机构的主要概况,探讨了它们的重点
构建了基于建构主义学习理论的翻转课堂教学模式,从教学目标分析、教学内容设计、情境设计、媒体资源库设计、自主学习与协作学习策略设计以及学习效果评价等角度,开展了信息
首先概述高速公路项目业主预算管理相关内容,然后分析目前高速公路项目业主预算管理存在的问题,最后以马鞍山长江公路大桥项目为例,提出均衡各项建设目标、严控预算执行过程
针对现有凸轮连杆组合机构由于凸轮机构的磨损而导致运动失真、一种凸轮对应的凸轮连杆组合机构只能实现一种轨迹的缺点,有人提出了用虚拟凸轮连杆组合机构来代替原机构的设
本文对8342位在广州工作的大中专毕业生的第一份职业与所学专业之间的相关性情况进行了实证研究。研究表明,近8年来大中专毕业生都存在着职业与所学专业不相关即"改行"的情况
本文回顾性分析了2016年6月~2017年11月本科采用达芬奇机器人辅助腹腔镜广泛子宫切除术的120例患者的临床资料,总结了术前检查、心理护理、术前准备、管道护理、膀胱功能训练
以中国学术期刊文献出版总库为数据源,对2003-2012年发表的信息法研究论文从科研群体、核心作者和核心期刊3个方面的h指数进行统计分析,从质和量两个方面对信息法论文进行深