【摘 要】
:
细粒度图像分类任务是计算机视觉领域一项极具挑战的研究课题。近年来,深度学习技术的快速发展极大地推动了细粒度图像分类任务的研究,各种网络模型算法涌现而出。细粒度图像分类任务的关键主要在于如何准确定位具有分辨力的关键区域并从中提取有效特征,但往往由于类间差异小和类内差异大,使得细粒度图像分类任务难以取得更优的分类效果。本文基于Vision Transformer(Vi T)模型和图注意力网络分别研究了
论文部分内容阅读
细粒度图像分类任务是计算机视觉领域一项极具挑战的研究课题。近年来,深度学习技术的快速发展极大地推动了细粒度图像分类任务的研究,各种网络模型算法涌现而出。细粒度图像分类任务的关键主要在于如何准确定位具有分辨力的关键区域并从中提取有效特征,但往往由于类间差异小和类内差异大,使得细粒度图像分类任务难以取得更优的分类效果。本文基于Vision Transformer(Vi T)模型和图注意力网络分别研究了两种场景下的细粒度图像分类算法,充分利用图像的多层次、多尺度、多模态和语义特征信息,以达到提升细粒度图像分类任务性能的目的。本文主要研究工作如下:(1)基于Vi T模型的细粒度图像分类。针对无文本的细粒度图像分类任务,本文结合了数据增强、多尺度输入、多层次Vi T以及交叉注意力提出了一种基于Vision Transformer模型的细粒度图像分类算法。首先,图像先经过数据增强获取一种破坏性的增强,之后将增强后的图像以小尺度和大尺度两种尺度的卷积核进行卷积操作,卷积后的两种特征图通过设计好的多层次Vi T,接着把从Vi T中输出的两种张量送入设计的交叉注意力网络,最后采用softmax进行分类。模型在四个细粒度图像分类公共数据集上的实验对比,验证了本文方法与目前主流先进方法相比具有较强的竞争力。(2)基于注意力网络推理图的细粒度图像分类。针对场景文本细粒度图像分类任务,本文结合了多模态语义特征提出了一种基于注意力网络推理图的细粒度图像分类算法。该算法中首先对提取的图像文本特征和局部视觉特征进行位置信息嵌入,并将其作为图节点生成的异构图通过元路径分解分别放入节点级注意和语义级注意的两级注意力网络推理图,接着,将输出的节点特征与提取的全局视觉特征进行融合以获得具有丰富语义的细粒度特征,最后采用softmax进行最终的分类。模型实现了多模态融合与图注意力网络的有效结合,且在两个场景文本细粒度图像数据集上与目前主流先进方法相比具有较强的竞争力。(3)细粒度图像分类系统设计与实现。本文采用C/S结构,MVC的设计模式,设计并开发了一款智能图像识别APP,该软件有效集成了本文提出的两种场景下的细粒度图像分类算法,可进行六大主题569类细粒度图像识别,同时支持用户拍照上传识别、图像文本自动检测、识别结果反馈及相似图像结果展示等功能。该系统识别图像种类多,且具有良好的用户交互和体验性,具有较好的实用价值和广泛的应用前景。
其他文献
湖泊是水资源的组成部分,在水循环过程中承担着重要的作用,同时也是社会经济发展必不可少的资源。由于气候变化和人类活动不断加强,我国湖泊面积发生了明显变化。此前由于传统方式处理大量遥感数据受限和其他因素的影响,国内研究大多集中在单个湖泊或区域湖泊的面积变化,综合探究全国范围内湖泊面积变化的研究还较少。遥感云计算技术出现之后,改变了原有的研究现状。它可以快速的处理和分析海量遥感数据,降低了大尺度长时间序
快递业是我国增长速度最快的行业之一,也是国家生态文明建设的重要领域,但快递业务在便利人们生活的同时也带来了过度包装、循环利用率低、环境污染等一系列问题。面对与日俱增的快递包装需求量,提高快递包装可持续性是快递业高质量发展的迫切要求。本文在包装设计理论的基础上,对快递行业发展、快递包装材质与结构、快递系统流程及利益相关等进行分析,总结归纳出了基于可持续设计理念的快递包装设计原则与方法。研究结果显示:
竹编作为中国传统民间手工艺已流传了数千年之久,随着材料、工艺的发展,其局限性愈发突出而被逐渐替代。但其精致的纹路、优秀的透气性、轻巧坚韧的结构仍有很高的利用价值。随着参数化设计的出现,增材制造技术的发展,将编织的结构形式与3D打印工艺结合已成为了可能。这将充分利用编织结构的优点且克服竹材的局限,大大提高产品的结构效益及其功能价值和应用性。本文通过文献整理与研究,对传统竹编的发展概要、器皿种类、结构
传统民居是各民族宝贵的物质文化遗产。景宁作为我国仅有的畲族自治县,当地畲民多生活在交通闭塞的山林中,其居住的畲族民居也因此仍沿用着传统的营造做法。本研究以景宁畲族传统民居营造技艺为研究对象,通过深度访谈与田野调查采集数据,运用类型学和比较研究等方法探究并阐释其营造体系与特征,构建景宁畲族传统民居体系,探研其与周边汉族地区及闽东北畲族地区营造体系的渊源。研究的第一阶段,从三方面对其进行分析和总结。营
随着城乡一体化进程的加快,城乡建设面积的持续扩张和绿地斑块面积的不断减少,导致城市热环境的持续恶化,高温区的聚集更是加剧了热岛效应。在节能减排和提升人居环境品质的大背景下,国内外关于城市层面的热岛效应有着大量研究并涌现丰富的理论成果,随着农村经济水平的提高,国内也开始聚焦乡村室内热环境的研究,然而关于乡村村域范围的室外热环境与农宅空间形态等信息的研究相对较少。本文基于国家自然基金面上项目(519
作为新一代宽带移动通信技术,第五代移动通信技术(5th Generation Mobile Communication Technology,5G)具有高带宽、低时延和大连接等特点,是实现人机互联的网络基础设施。毫米波(30-300GHz的电磁波)通信为5G带来速率和时延优势的同时,也会为5G网络上层的传输协议的设计,特别是拥塞控制机制的设计带来挑战。(1)目前网络中广泛使用的TCP协议采用“慢启
城市热岛效应的增加导致了城市供热环境变化,同时提高了城市建筑能耗。乡村建筑也因为施工技术与设备施工的不标准化而导致了更多的能耗浪费,目前乡村建设能源已经成为了中国能源消费总量的主要部分之一。热辐射是影响建筑室外热环境的重要因素。在夏热冬冷地区,夏季的太阳辐射是建筑的主要得热途径。植被是建筑室外环境中必不可少的组成部分。论文中根据这些现象,进行了球状冠体乔木植物对邻近建筑物表面热辐射理论计算的相关研
森林康养是健康中国建设的重要形式,而我国森林康养基地规划的研究尚处于起步阶段。本研究从健康医学与生态心理学理论中梳理环境与人对话的六觉,架构规划的六觉模式与六觉量表,并通过森林康养基地规划项目实践对其进行检验与修正,之后拓展应用于新的项目,以提供一种森林康养基地规划方法的探索与借鉴。首先对基础理论进行研究。梳理国内外的相关文献,对当前已有森林康养相关理论与实践研究情况进行总结。结合健康医学与生态心
目前,由于地势地貌的复杂性和资金所需,我国许多城市仍存在部分原始铁路平交道口,在这样原始的铁路平交道口,如何保障列车以及过路行人、车辆的安全是铁路相关部门亟需解决的问题。传统的铁路平交道口安防依靠人力进行视频监控,如今随着深度学习的不断发展,这种监控方式已逐渐走向智能化。本文主要结合深度学习技术对铁路平交道口的行人、车辆检测与识别方法进行了研究,具体研究内容如下:(1)首先,针对城市中的货运铁路平
近年来,心理问题引起的恶性事件在高校频频发生,对学生、学生的家庭和学校都造成了非常严重的影响。应对这一问题的关键是要及时对存在心理危机的学生进行识别。目前,高校心理工作者通常使用心理问卷对学生是否存在心理危机进行第一次筛查,用心理档案进行第二次筛查。在分析心理档案时,心理工作者需要花费大量的时间对学生是否存在心理危机进行判断,因此这项工作在实际工作中很难及时有效地进行。本研究提出一种基于随机森林、