迁移学习提高多类图像分类精度的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yinfeiyangfang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去十年中,深度学习以惊人的速度发展。深度神经网络模型用于解决各种实际问题,其中一些问题需要更高的精度和极低的回归系数,包括图像分类、目标检测、自动驾驶汽车的实时分类和监控系统。由于其在各种视觉任务中的应用,图像分类受到了相当大的关注,它可助于解决复杂问题。深度神经网络在很大程度上取代了传统的滤波器,可是目前的成像技术无法完全代替人力。因此,考虑如何通过使用迁移学习技术来改进现有的视觉成像技术十分重要。本文的目的是利用转移学习技术提高多类图像分类的精度。深度卷积神经网络结构的发展对于提高图像分类任务的性能至关重要。由于照片的前景复杂,以及不同类别图像之间的相似性,在图像识别方面仍然存在重大障碍。CNN体系结构VGG19、Res Net50、Inception V3和Xception通过具有恒定的基线学习拓扑来提高各自模型的性能,从而得出用于图像分类的结论。多类图像分类工作是使用现有CNN模型和转移学习技术的组合来完成的。主要研究内容如下:根据任务要求,已构建并研究了VGG19、Res Net50、Inception V3和Xception模型的多类图像分类布局方法和体系结构。使用Jupyter notebook中的Keras库,在同一数据集上独立构建所有模型。在后端,使用了Tensor Flow。预处理中的图像增强方法正在得到应用。研究了均值归一化的重要性,并确定了各种数据扩充的方法。通过将输入转换为浮点Num Py数组来预处理输入,该数组生成成批量的浮点张量。研究了模型的过拟合和欠拟合问题,以及是否需要退出正则化。为了提高精度,已配置回调和其他超参数。讨论了降损函数的要求及其对模型性能的影响。分类交叉熵用于评估损失函数。选择Adam优化器来改变神经网络的属性,如权重和学习率,并选择Soft Max分类器来预测图像各自的类别。本文研究了转移学习在多类图像分类中的主要应用方法,并将其应用于我们的多类图像分类挑战。为了减少计算成本和训练时间以及昂贵的数据标记,采用了任务转移学习方法。在迁移学习之后,我们为不同的模型设置不同的可训练参数,以便对模型进行再训练。在编译现有模型并使用迁移学习方法后,我们对CNN模型进行了微调。采用浅层调谐方法,并研究了应微调哪一层。利用分类任务结果进行比较。将用于多类图像分类的深度学习算法的性能与使用相同参数的不同数据集的性能进行比较。与所选预训练模型的精度进行了比较,结果表明,我们的微调模型精度较高;在训练和测试以及模型的整体准确性方面。我们使用同一模型对不同的数据集以及实验中使用的数据集进行了精度比较,发现我们的精度更高。演示深度学习算法的易用性。实验证明,通过确定准确的参数,可以提高多类图像分类的精度;例如学习率、批量大小以及在微调过程中确定准确的可训练参数。通过我们选择的脱落正则化和参数0.5,表明模型不受过拟合问题的影响,从而提高了精度。几位作者使用相同的模型进行了研究并进行了微调;但我们的微调方法和参数与其他方法不同。在迁移学习阶段之后,我们立即开始微调阶段的再训练;这样我们就可以利用预先训练好的模型知识;因此,我们更新了选择性层权重,并减少了计算时间。预先训练的模型使用SGD、RMSprop优化器,但我们使用Adam优化器;在将输入放入分类层之前,我们使用了全局平均池层;因为全局平均池层保留了单个图像特征贴图的深度。在我们的实验中,我们使用了具有选择参数3的早期停止函数。这可以防止模型过度训练。
其他文献
顶岗实习是职业教育中非常重要的一个教育环节。近年来随着职业教育越来越受到国家的重视,职业教育学生人数也在不断地增加。与此同时,学生在顶岗实习期间发生的各种问题也在不断地凸显,其中最突出的就是学生在实习过程中因身体受伤而无法得到有效救助、实习生加班加点现象严重、薪资待遇等合法权益得不到保障等。如何保障学生顶岗实习期的权益,成了学生、家长、社会普遍关心的问题。本文以上海A职业技术学院为例,以该校313
学位
深度森林作为深度神经网络的一种有效的替代方法,具有复杂度低、超参数少、健壮性高等特点,在分布式机器学习领域中得到了广泛的应用。最近,一个高效的分布式深度森林系统Forest Layer被提出,其设计了一种基于细粒度子森林划分的任务并行算法,以提高深度森林的并行计算效率。然而,Forest Layer的子森林划分是静态的、一次性的,对分布式计算环境没有适应性,并且粒度划分的大小对系统性能有重要影响。
学位
在一些电网设施不完善的区域,使用电线供能的诱虫灯无法正常工作。因此,开发安全高效的太阳能诱虫灯可以有效拓宽灯光诱控技术防治害虫的应用范围。鉴于此,本研究探讨了不同类型太阳能板、不同类型蓄电池、不同朝向和不同太阳能板阴影面积对太阳能蓄电池储电量的影响,筛选出最优的供能组合,再将其与前期筛选的花生害虫专用候选光源相结合,制作和生产太阳能光陷阱捕虫器,将其用于防治花生田害虫,分析了太阳能光陷阱捕虫器诱集
学位
改革开放以来,广东省GDP多年持续领跑全国,成为当之无愧的经济领航者、排头兵。然而与其经济强劲发展的势头相比,广东省高等教育从规模到质量总体落后于北京、上海、江苏等地。2017年以来,经济运行进入降速提质新阶段,广东省积极推动高等教育发展重心向地市级政府下移,试图带动尚未举办本科层次高等教育的地市级政府,面向本地产业体系,举办应用型本科院校。通过产学研之间的良性互动,实现高等教育真正成为推进“双区
学位
搅拌流化床是在普通流化床内加设了内搅拌结构。通过机械搅拌,改善流化床内流体和颗粒分布特性,实现流化床反应器内流体和颗粒流动的深度控制。搅拌流化床性能具有如下特点:1、搅拌流化床具有与普通流态化的特征:流体颗粒接触均匀、两相相对速度较大和操作连续方便。2、由于加有内搅拌结构,在搅拌作用下,物料颗粒被分散,避免颗粒的沉降和结团,提高了流化床反应器性能。3、拓宽了普通流化床的适用范围,对高含水粉粒状物料
学位
鱼类通过摆动鱼体和鱼尾跟周围的流体相互作用产生推力来游动。鱼类运动的研究旨在了解鱼类如何选择尾部摆动的频率和模式(步态),如何通过水动力产生推力,以及如何调整身体形状和肌肉激活性以调节游动速度。使用各种方法对鱼类的运动进行了研究,包括活鱼的运动学和生物力学数据分析、使用柔性鱼体模型进行的游动实验以及流体中振荡箔的计算/实验分析。使用这些方法已经形成了一些理论。通过这类研究,我们可以建造更好的结构、
学位
数字时代下,随着多媒体资源的爆炸式增长,人们的学习方式早已从原来的单纯的文字输入,拓展为如今的文字、图像、图表、音像、视频等多模态输入。为此,《普通高中英语课程标准(2017年版2020年修订)》(下称《新课标》)已将“看”能力纳入英语核心素养的关键能力,而基于《新课标》编写的各类高中英语教材也都新增了视频板块,意图通过多模态资源丰富单元主题意义,促进学生英语技能的融合性发展。通过对国内使用范围最
学位
当今世界是多元化的世界,英语作为国际通用语,既是作为不同国家沟通的工具,也是各种文化沟通的桥梁。在跨文化交际中,通过对不同优秀文化的比较,形成对不同文化的客观、理性的认识,不仅要学习外国的文化精华,也要树立本土文化自信。通过在新人教版高中英语必修教材和NOW语料库中检索文化关键词的频率、呈现方式和搭配,本研究可以了解不同视角下中国文化的传播现状,为完善我国高中英语教材本土文化内容的编写与组织提供建
学位
数字化正在越来越迅速和深入地渗透到我们的活动和日常生活的各个领域。如今,数字技术在工业企业、教育机构、医疗机构和每个家庭中得到了积极的应用。它们被用于创建额外的虚拟现实,用于大数据分析和机器学习,用于机器人,用于3d打印,用于人工智能,医疗保健和科学研究领域。全球流行的情况推动了组织加速数字化的趋势。数字经济中各组织的业务条件发生了变化,信息量呈指数级增长,通信技术在全球范围内得到普及,因此有必要
学位
处于信息化时代的背景下,在多模态交际方式的影响下,学生的阅读习惯和学习方式正在逐渐发生变化。随着《普通高中英语课程标准(2017年版)》中在语言技能中增加了“看”这一技能,要求教师在解读语言资源时,应该重视起视觉资源在教学中起的作用。信息形态的不断变化促使着教育朝着数字化、多媒体化、网络化的方向发展,从而实现教育信息化。中日两国同样作为亚洲国家,有着相似的文化背景。在新课改背景下,中国出版了新的人
学位