基于弱监督学习的图像识别与转换算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lanqie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉领域的各类任务从本质上都是帮助人们更好地理解图片,如果能寻找到彼此之间的相关性并加以利用,对完成每项具体任务都有促进作用。目前计算机视觉领域的各类算法模型对于自然场景下图像的处理效果都不理想,以Pascal VOC数据集为例,图像往往具有多目标、目标尺度不一、背景复杂等情况。图像识别与翻译是计算机视觉领域的重要研究课题,相关算法对于自然场景图像的处理效果都有待提高,同时能否利用识别模型的标签信息来提高图像翻译领域中转换任务的实验效果也是本文研究的重点。一般的物体分类模型由于所使用训练数据集的局限性,在测试自然场景图片时效果往往不好,因此这类模型泛化效果差,无法适应不同的任务需求。本文针对现有成熟的在ImageNet数据集上训练的物体分类模型无法直接迁移到Pascal VOC数据集上的问题,结合弱监督物体检测任务的解决思路和模型框架,利用迁移学习的方法,将VGGNet物体分类模型应用到VOC数据集上。本文完成了对自然图像的识别任务,设计了对比实验,验证了算法的可行性。目前图像转换模型也存在着在自然场景下转换困难、图像失真等问题,图像转换模型无法只关注特定场景对象,比如在无监督的情况下,如果图像没有配对或对齐,网络必须另外了解场景中要转换的特定区域。本文利用弱监督识别模型为源域和目标域的物体转换提供大致的位置约束,引导CycleGAN生成器生成与真实图片差异更小的图片。本文完成了对CycleGAN模型的优化,并且对比了模型改进前后生成的图片效果,进行了定量与定性的分析,验证了方案可行性。本文的弱监督识别模型和基于识别网络的CycleGAN改进模型针对以Pascal VOC数据集为主的自然场景图像理解问题给出了新的解决思路。
其他文献
会计职业道德建设是社会主义思想道德建设的重要组成部分,是社会主义市场经济发展的根本要求。
本研究采用负载型TiO2膜作为催化剂降解有机磷农药敌敌畏,探讨了光催化反应时间、溶液的初始浓度对敌敌畏降解率的影响。试验表明,不同初始浓度的敌敌畏在经过90minUV/TiO2处理
针对合成孔径雷达(SAR)图像的特点及标准图割分割算法计算量较大等问题,提出了一种基于图割及均值漂移(Mean Shift)的高效的SAR图像强散射目标分割方法。该方法利用均值漂移算法
幼儿舞蹈属于孩子的艺术天地,幼儿教师需要根据幼儿实际精心编排舞蹈,才能够引起幼儿的广泛兴趣,并在具体参与过程中形成体能素质和意志品质。幼儿舞蹈选材要适合幼儿年龄特
兴趣点(point-of-interest,POI)推荐是基于位置的社交网络(location-based social networks,LBSN)中一项重要的服务。针对目前推荐算法存在的噪声数据影响推荐质量,用户个性化程
目的探讨心理护理干预在耐多药结核患者治疗中起到的作用,为临床对耐多药结核患者治疗提供依据。方法回顾性分析2010年3月至2012年9月我医院收治的耐多药结核患者51例采临床
目的:探讨利用HPLC-紫外检测器(UV)和HPLC-蒸发光散射检测器(Evaporative light scattering detector, ELSD )测定乳酸环丙沙星氯化钠注射液中环丙沙星含量,比较两种检测方法的优
文章旨在分析农村土地流转中租金的确定过程及结果.文章认为,土地的重要性、农民丧失非农收入来源的可能性以及非农收入的多少等因素决定了农地流转的租金,并最终影响到土地
<正>m16磁敏免疫分析系统,由m16磁敏免疫分析仪、电子质控卡、液体质控品、配套检测试剂组成,应用世界先进的生物芯片、智能微流控、纳米磁颗粒技术,可以为临床提供媲美中心