基于深度学习的图像识别算法研究

被引量 : 33次 | 上传用户:wangchun2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是日常生活中最常见的信息源之一。相对于其他信息源,图像信号包含的信息量巨大,其复杂、冗余等特性将其和其他种类的信息源区分开来。对图像信号的处理难度相对较高,而人类视觉系统在图像处理方面展示了极其出色的能力,吸引了许多研究者的关注。研究者希望通过仿生的方法,用人工神经网络来模拟人类视觉系统的识别能力。在浅层人工神经网获得一定成功之后,深层神经网络的研究由于遇到了训练代价过高、陷入局部最优解等困难而一度沉寂。近年来深度学习模型的应用使深层神经网络的研究有了新的进展,带来了新的研究热潮。本文在研究深度信念网(deep belief network, DBN)的基础上,构建了一种能跨问题领域识别图像的深度信念网模型。根据DBN网络分层抽取图像信息的特点,本文使用底层共享高层分离的方法,将多个领域的DBN模型底层合并起来抽取样本空间的低层特征,而高层神经元相互分离,各自抽取本问题领域的高层特征。共享层神经元在抽取低层特征的同时也对输入样本的问题领域进行初步识别,将输入样本导入对应的高层神经元,而高层神经元将给出样本在对应领域的识别结果。这种跨域DBN模型是对人类视觉系统跨问题领域图像识别能力的模拟,具有仿生学意义。同时,神经元底层共享的结构使得本文模型能够利用领域混杂的无标签样本对底层模型进行无监督学习以提高识别性能,这在具有海量领域混杂无标签样本的网络环境中具有积极意义。另一方面,高层分离的神经元使得本文模型可以从模型上进行并行计算,减少网络的训练时间。本文使用Theano库实现了跨域深度信念网模型,并在MNIST字符数据集和COIL物体数据集上验证了识别结果。实验证明,本文模型与传统模型的识别效果相当,而在领域混杂的无标签数据集大于有标签数据集的情况下,本文模型可以达到更好的识别效果,说明除了仿生角度的意义之外,本文模型还能利用领域混杂的无标签数据集发掘有价值信息。同时,本文研究表明,在多层神经网络中,底层神经元在有监督训练中的工作可以被无监督训练替代。根据这个发现,本文修改了传统DBN的训练方法,使本文模型可以方便地实现并行优化。本文还使用Hadoop框架为本文模型设计并实现了并行优化。实验结果表明,在各领域样本集大致相等的情况下,并行框架能够有效地提升模型训练速度。
其他文献
公共政策环境影响评价的概念是指预测、分析和评估在制定并实施公共政策后可能引起的环境影响。对公共政策进行环境影响评价能够预防或减少制定和实施公共政策的过程中造成的
全面预算是一种有效的企业管理工具,同样也是一套系统的管理机制和方法,全面预算管理具有预算编制、执行和监控、调整、考评多种职能,优化了公司资源,规范了公司行为,提升了公司的
分析了逆向设计与正向设计的差异,给出了逆向设计的一般流程,并结合汽车设计特点,论述了汽车逆向设计对于企业积累设计知识、明确产品定位、实现快速开发的重要性,在此基础上
方剂是中医临床用药的基本形式,其核心是配伍,君臣佐使是方剂配伍原则,多成分多靶点协同作用是方剂的作用机制。然而,中药方剂有效成分不清、靶点不明,严重阻碍了中药方剂作
领导人的演讲历来是政治语篇的重要形式,同时也是学术领域的研究重点,根据调查研究可知近五年以来已有六十多篇硕博论文以及学术报刊发表了关于演讲语篇的研究分析。作为世界
严重的少年违法犯罪问题引起了世界各国的普遍重视,自1899年美国伊利诺斯州的第一部少年法以来,少年司法制度体系在世界大多数国家都已经建立起来。在当前的国际环境和司法形
翻译实践中,译者常常会面临采取何种翻译方法、策略,选取何种翻译标准这些问题,只有解决了这些问题,译文才会自然。面对语言、文化等方面的差异,对原文进行恰当的创造性叛逆,
公信力是基金会的重要声誉支撑,近年来由于一系列的慈善丑闻事件严重的影响了基金会的声誉,对基金会的发展产生了影响,人们也对基金会的信任日益下降,同时对基金会透明度的关
2014年被称作是网络自制剧元年,网络自制剧顺应了网络视频行业发展的趋势,已然成为网络视频行业下一轮角逐的核心。它充分利用了网络传播的特点,改变了传统的影视观念,已经成
目的:分析儿童频繁瞬目的病因。方法:收集2010年01月-2012年01月在我院眼科就诊的频繁瞬目的2~13岁儿童256例,依据其发病过程、治疗经过、视力、眼位、结膜、角膜、屈光及其