【摘 要】
:
图像分类(识别)任务是一个经典的计算机视觉任务,在学术研究中,通过对这一任务的深入研究,推动了整个计算机视觉领域,甚至深度学习领域的发展;在日常生活中,图像分类技术在社交媒体、医学影像、安防监控、遥感成像等领域发挥着重要的作用。受设备性能受限、成像环境复杂、成像距离过远等因素影响,用于分类的图像会无可避免地遇到降质,形成低分辨率图像。低分辨率降质会导致图像中信息丢失,从而降低图像分类精度。为了提升
论文部分内容阅读
图像分类(识别)任务是一个经典的计算机视觉任务,在学术研究中,通过对这一任务的深入研究,推动了整个计算机视觉领域,甚至深度学习领域的发展;在日常生活中,图像分类技术在社交媒体、医学影像、安防监控、遥感成像等领域发挥着重要的作用。受设备性能受限、成像环境复杂、成像距离过远等因素影响,用于分类的图像会无可避免地遇到降质,形成低分辨率图像。低分辨率降质会导致图像中信息丢失,从而降低图像分类精度。为了提升低分辨率图像分类的准确率,需要对图像中损失的信息进行重建。然而,现有的重建方法通常面临着两个问题:(1)重建模型参数量和运算量过大,导致实际应用成本过高。(2)重建算法依赖语义标签,当没有语义标签用于训练时算法会失效。针对以上问题,本文进行两方面的研究:针对第一个问题,本文中提出了一种基于双向映射网络的低分辨率图像分类方法,实现了推理速度与分类精度之间的平衡。受低分辨率与高分辨率图像之间的转换互为逆操作这一特性的启发,本文中利用可逆神经网络设计了一个轻量的双向映射网络。该网络将低分辨率图像分解为高频与低频两种信息,并利用可逆神经网络对这两种信息进行增强。此外网络通过对逆向任务的学习为低分辨率图像增强提供了辅助信息。最后,通过引入采样模块进一步降低了运算量。实验结果表明,本文中提出方法能以较少的参数量和运算量达到与其他方法类似的分类精度。针对第二个问题,本文中提出了一种基于长距离特征依赖捕捉的低分辨率图像分类方法,摆脱了对语义标签的依赖。本文通过统计实验分析了不同结构的低分辨率图像特征在深度表示空间中的分布,揭示了低分辨率这种降质会导致有不同结构的图像块在深度表示空间中有相似的特征分布这一规律,从而提出了一个基于自注意力机制的特征增强网络。该网络通过自注意力机制来捕捉长距离特征依赖关系,用于消除局部降质特征的歧义性。本文中利用预训练的分类网络提取清晰图像的特征,用于训练特征增强网络的监督信号,从而消除了对语义标签的依赖。实验结果表明,在不同倍率降采样的低分辨率数据集和不同的分类网络上,本文中提出的方法均可以显著提升分类精度。
其他文献
文本分类是自然语言处理领域中最经典的任务之一。然而,在文本分类的具体应用中,数据集的分布方式常常具有不均衡性,这通常会导致传统的分类器更倾向于多数类文本,而忽略少数类文本的存在。实际上,有时对少数类文本的预测反而更有意义。因此,如何处理不平衡的文本数据集以减轻其偏态分布是一项至关重要的任务。首先,本文通过引入文本数据增强技术来处理类别不均匀的问题,即扩充少数类文本的数目使数据集更趋向于均匀分布。接
近年来,我国大科学装置得到了快速发展,包括强磁场在内的极端物理场科学实验装置对特殊材料的需求日益迫切。Cu-Ag合金因具有优异的力学和电学性能,是强磁场实验装置等领域的关键支持材料之一。对于强磁场领域的应用来说,要求Cu-Ag合金的抗拉强度≥1000MPa,相对电导率≥75%。目前,我国还不能生产达到这一要求的高强高导Cu-Ag合金,相关产品完全依赖进口。因此,发展我国自己的Cu-Ag合金,对于我
随着互联网的飞速发展,传统的TCP/IP架构已经难以面对日益增长的用户需求。信息中心网络(Information-Centric Network,ICN)中无处不在的缓存使内容更靠近用户,能够有效减少用户访问延迟,降低链路负载,提高网络性能。在实际的应用中,数据更新会导致缓存中出现过期的内容,需要使用缓存强一致性策略以保证用户获得最新的内容。对缓存建立准确的分析模型是分析网络性能、进行网络规划的基
目的:观察阴茎海绵体Cx43在间质Cajal样细胞的表达,初步探讨Cx43的改变对间质Cajal样细胞的影响方法:选取成年健康的雄性SPF级豚鼠50只并按照随机数表法分为五组,分别为正常组(normal组)10只,假手术组(sham组)10只注射生理盐水(20 ul/只)作为对照,腺相关病毒组(AAV组)10只注射腺相关病毒(20 ul/只)过表达Cx43,Gap27组10只注射浓度为0.05 u
近年来,在文本或场景分类和医学诊断等机器学习的各个应用领域或场景中,随时都在产生越来越多的大规模数据,而这些数据往往存在大量的冗余特征,它们会对后续的机器学习与训练任务带来影响。因此,作为一种经典的降维方法,特征选择技术被广泛用在数据挖掘和分析,数据清洗和预处理过程中。尤其是对于多标签数据而言,多标签特征选择技术需要根据标签相关性信息去除冗余的噪声特征,从而可以提高多标签学习模型准确率,实现数据集
增强现实(Augmented Reality,AR)技术可以将虚拟的图像信息叠加到外部的真实环境中,使观察者既能沉浸在现实世界中又能接受到显示设备提供的信息,被普遍认为是下一代主流显示技术。作为实现AR显示的重要手段,基于衍射光栅的波导式近眼显示设备在紧凑性和便携性等方面有着突出的优势,逐渐取代了传统的折反射式设备,成为目前AR设备的首选设计方案。出瞳扩展作为光波导近眼显示系统的优点之一,可以为人
现实世界中存在着许多与决策有关的场景,例如辅助驾驶、医疗诊断、金融预测和无人机集群对抗等。随着人工智能、大数据等信息技术的进步和统计学、博弈论等数学理论的应用,大量的模型和算法应运而生,并在各种决策场景发挥了重要的辅助或主导作用。对于社会、科学或经济等领域的决策问题,决策的质量和可靠性至关重要。考虑到实际的决策场景中的各种不确定、不可知因素,研究非完全信息下的决策问题,具有重要的理论研究价值和实际
工业产品表面缺陷会影响到产品的正常使用、造成安全隐患并损害产品的美观性。受设备与技术的影响,实际生产中大多数情况下只能采用人眼检测的方式,效率与精度较低,严重降低了工业产能。为了缓解该问题,工业缺陷检测相关从业者引入基于机器学习的计算机视觉算法,人为设计一些特征提取算子,提取缺陷图像特征并在一定程度上实现了对缺陷的自动检测与分类。但是这些方法鲁棒性不高,对不同场景适应性差,难以应对实际生产中形态多
新型功能性材料的发现对推动社会发展特别是工业技术的进步有重要意义,其旨在进行材料的有效逆向设计,即有效地探索目标区域的广阔化学空间、快速准确地预测候选材料的性质。同时,由于晶体材料存在广泛和数据驱动的要求,无机晶体结构预测是材料发现最基本的任务之一,也是本文的研究重点。传统的逆向设计策略主要包括高通量虚拟筛选、全局优化算法,但它们存在需要消耗大量资源进行密度泛函理论计算等局限性。随着深度学习的发展
由于仿人轮式机器人具有较强的操作能力和机动性,在家庭服务和工业生产等各个领域都具有良好的发展前景。但是由于其具有强耦合性和冗余性,在完成复杂任务时传统方法难以进行合理规划。因此,本论文以任务为机器人执行的基本单位,对机器人的多任务控制进行研究,使仿人轮式机器人能够对不同优先级的任务进行规划。本论文的研究内容可以概括为:(1)设计了一种基于自适应神经网络控制的仿人轮式机器人的轨迹跟踪控制方案。通过采