基于深度学习的图像分类研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:saien
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是人类感知事物的视觉基础,人们可以通过图像从外界获得重要信息,因此让机器自动完成图像识别、分类具有重要意义。图像分类最重要的部分就是特征提取,研究高效的特征提取算法在图像领域至关重要。近年来,深度学习算法在图像分类方面取得了突破性进展,它通过建立、模拟人脑的分层结构,对外部输入的声音、图像、文本等数据进行从低级到高级的特征提取,从而得到更准确且接近物体高级语义的特征,所以深度学习在图像分类领域具有广阔的应用空间,尤其是卷积神经网络(CNN),是一种识别率很高的深度学习模型,其优点是能够直接与图像像素进行卷积,从图像像素中提取图像特征,另外,卷积神经网络的权值共享属性和池化层使网络需要训练的参数大大减小,简化了网络模型,提高了训练的效率。Caffe框架作为当前主流的深度学习框架,其在工业界以及学术界得到了广泛应用。在本文中,使用了Caffe框架对自己的图像数据集进行了训练与预测,并使用Caffe的python接口对卷积层的特征以及全连接层的输出进行了可视化,并且做了分析和研究。Siamese网络是一种孪生神经网络结构,它拥有两个相同的神经网络,且它们共享着权值,所以输入必须是成对样本,要么是相同类别的正样本,要么是不同类别的负样本。它的作用是可以把图片信息映射到低维的特征空间,因此Siamese网络也可以用于降维。本文基于它的对比损失函数对其样本的输入做了两点改进,第一种是对输入样本进行了重组,重组方法是在批量随机梯度下降(SGD)的分组中,寻找特征距离最远的正样本或特征距离最远的负样本,使它们组合在一起,从而使每个样本对都发挥其最大作用;第二种是丢弃无意义的输入样本对,在训练到一段时间后,有些负样本对的特征距离已经超过阈值margin,这时可将其丢弃以避免使它无意义地送入网络计算。本文使用Caffe完成了这两个创新点内容的代码编写并进行了实验结果的分析,在实验中,使用了MNIST手写体数据集,利用Siamese网络将其特征映射到平面空间,并进行了直观性的数据分布展示。对于实验结果的评测,本文采用了Test loss曲线以及Accuracy曲线作为评测手段,对原始方法和改进方法进行了量化的评测,实验证明,通过这两点改进使得Siamese网络分别在准确率和速度上有所提升。
其他文献
分析了永磁同步电机在三相静止坐标系和dq旋转坐标系下的数学模型,介绍了采用i_d=0的矢量控制结合速度/电流双闭环的永磁同步电机控制系统方案,详细推论了系统速度/电流双闭
<正>重视数学应用问题教育是新课程实施的重要标志,无论是数学课标、数学教材,还是高考数学试题,无不充分体现.迄今,涉及生产和生活实际的数学应用问题已经成为每年高考数学
在市场经济条件下,任何投资都有风险,证券投资风险尤甚。在证券市场中,各主体之间的利益冲突不可避免。投资者心甘情愿承受证券交易的市场风险,但是承担欺诈或其他违法行为导
建设市政道路工程是促进城市化发展的重要内容,随着城市化进程,市政道路改造工程越来越多。以石狮市区道路改造工程为例,通过分析老旧混凝土路面"白改黑"改造工程中的技术问
随着信息时代的不断发展,人们对于软件的需求越来越多,对软件的功能要求也越来越高,仅仅依靠软件正向工程无法满足人们的需求,因此软件逆向工程技术应运而生,为人们在设计和
<正>产科疾病具有三变:"突变、多变、易变",因此产科医生处在一个可能随时发生危急重症的处境中。为应对这种情况,产科快速反应团队(rapid re-sponse team,RRT)这一概念被提
<正>在缤纷异彩的舞蹈寰宇中,滋长于博大秀慧的吴越文化,撷取自古朴清雅的昆曲文化里的昆舞艺术,以其自成一体、独树一帜的表演风格成为中国古典舞体系的一枚新生瑰宝。它将
中共十八大着重强调了生态文明建设,与经济、政治、文化、社会建设一并纳入中国特色社会主义事业的总体布局中,成为中国发展的主要任务之一。十八届五中全会提出了“创新、协
争取用和平的方式解决台湾问题,是20世纪50年代中期以来中国共产党人始终追求的政治目标。进入新世纪后,中国共产党十七大正式呼吁结束两岸敌对状态,达成和平协议,构建两岸关
经济的周期波动向来都是全球性经济发展的一个问题“瓶颈”,而降低经济波动并保持稳定、持续的经济增长也成为世界各国、政府进行经济宏观调控的中心目标,同时也成为各国经济