【摘 要】
:
随着大数据时代的到来,图像数据的采集变得越来越简便与多样化。在现实应用场景中,由于采集设备、拍摄角度、目标物遮挡等外部条件是动态变化的,因此采集到的图像数据即使表示的是同一类目标,数据分布也几乎都是不一致的。大多数现有的机器学习算法是基于训练数据和测试数据分布相同的假设进行训练和测试,并不适用于处理在复杂的现实环境采集到的图像数据。作为迁移学习方法的具体应用,交叉领域识别可以有效解决上述问题。交叉
论文部分内容阅读
随着大数据时代的到来,图像数据的采集变得越来越简便与多样化。在现实应用场景中,由于采集设备、拍摄角度、目标物遮挡等外部条件是动态变化的,因此采集到的图像数据即使表示的是同一类目标,数据分布也几乎都是不一致的。大多数现有的机器学习算法是基于训练数据和测试数据分布相同的假设进行训练和测试,并不适用于处理在复杂的现实环境采集到的图像数据。作为迁移学习方法的具体应用,交叉领域识别可以有效解决上述问题。交叉领域识别是一种利用源域数据与目标域数据之间的内在联系将从源域学习到的知识迁移到目标域中,以实现知识复用的学习方法。此外,如何将在现有相关领域的大量标签数据中学习到的知识,与新领域的标签缺失数据的信息进行匹配,从而学习到可迁移的知识,这对快速提升模型的学习性能尤为重要。因此,在知识复用的过程中,如何减少不同领域之间数据分布差异,寻找有效的、域不变的特征是本文研究的重点与难点。为此,本文提出了用于交叉领域识别的投影交叉重构方法。该方法是利用来自不同领域但具有相同标签的数据间具有很强的相关性的共识而设计的一种新的数据重构方法。首先,为了利用不同领域相同类别数据之间的信息,该方法对源域和目标域的数据进行重新排列,将来自不同领域中标签相同的数据各自排列在一起形成两个新的交叉数据矩阵,作为新源域与目标域。然后使用两个不同的投影矩阵将新的交叉数据投影到两个近似子空间中得到投影数据。并在不引入任何额外矩阵的情况下用投影数据本身作为重构系数矩阵,在投影数据间进行交叉重构。这保证了来自不同域的数据可以很好地相互交织,并且能够将表示同一目标但分布不一致的数据相互对齐。因此,该方法解决了交叉领域数据分布失配的问题,能够得到有判别性的、可迁移的特征表示。同时,该方法将分类器学习和特征表示学习集成到一个统一的框架中,使得这两个任务可以迭代更新直到满足终止条件,从而避免局部最优问题。为了检验本文提出的投影交叉重构方法的有效性,我们将本文方法在六个不同种类的公开数据集上,与相关领域的八个对比方法进行了大量实验。实验结果证明了本文算法的识别率比现有的交叉领域识别方法提升了2%~5%。同时通过对模型特征表示的可视化实验,证明了本文算法可以有效地减小不同领域但相同类别的数据之间的分布差异。通过收敛性分析实验,证明了本文算法可以在5次迭代内快速达到收敛。通过对模型的参数敏感性分析发现,子空间的维数变化对本文方法识别率影响不大,证明了方法的鲁棒性。综上所述,本文通过理论分析与实验证明了本文提出的算法是切实可行,且具有重要现实意义的。
其他文献
工业产品质量在线实时视觉检测是智能制造的一项重要工序。目前主流的检测基于人工提取特征,然而这种方法维护成本高和系统迭代慢。另外,面对复杂检测场景,往往难以有良好效果。深度学习作为一种新型人工智能技术,在视觉任务上获得优异性能。但是,深度学习模型性能严重依赖大量带标签的样本数据。在视觉检测任务中,缺陷样本是少量,而且缺陷区域的标记是困难的,耗时的。解决此问题方法主要有:标记框和像素级标记。相比前者,
近年来,卷积神经网络成为人体姿态估计的主流方法,但是网络结构复杂,在提升精度的同时也带来了大量参数与运算量,难以支持在算力与存储能力受限的终端设备上的实时应用。因此,本文从模型设计的角度出发,以优化模型运算量与精度的平衡为导向,研究轻量且高效的人体姿态估计算法,并以此为基础实现针对健身场景的动作相似度分析系统。本文的主要工作包括:1.结合轻量级卷积神经网络的特点,对Simple Baseline网
进入21世纪后,中国的国力不断发展,人口素质不断提高,人们对工业产品的质量也提出了更高的要求,与此同时,中国的人口红利期已过,人力成本逐年递增,尤其受新冠疫情的影响,导致招工难的问题日益凸显,这对‘中国制造2025’提出了更高的要求,机器换人的政策势在必行。工业机器人作为智能制造的最终执行者,它的研发与推广是机器换人政策实行的重要一环。本文将在已有的并联机器人架构的基础上,针对以CR2032电池生
产品质量检测是工业生产制造过程中的重要环节。传统人工提取特征算法在换向器产品质量检测中存在各种不足,无法满足自动质检要求。为解决此问题,本文探索深度学习方法检测换向器侧面划痕缺陷和端面缺料缺陷,深度学习方法能够自动提取特征,其泛化能力强,期望比传统视觉算法有更好的检测稳定性与准确度。本文主要的工作如下:(1)为解决换向器侧面划痕多尺度检测和细小划痕检测两个问题,提出基于编码器-解码器结构的语义分割
为了解决交通拥堵和交通污染,大容量、高效、准时、安全的城市轨道交通(地铁,轻轨,有轨电车)已成为城市交通发展的最终解决方案。手动检查存在一系列重大问题,在地铁检查行业中,需要更多基于技术的便携式和小型检查设备。因此,本文设计了基于无人机采集图像的轨道缺陷检测系统,主要工作如下:在课题准备阶段,本文首先查询了当下四种主流的轨道缺陷主要检测方案;研究了现在普遍使用的地铁检测方案,深入地铁巡检一线了解现
出租车作为公共交通系统的重要补充,在改善出行服务,提升道路运力方面发挥着较为重要的作用。在实际生活中,由于人群活动复杂多样且各区域人口分布不均,这导致人群的出行需求在时间和空间分布上具有较强的随机性和波动性。出租车因无法及时感知人群出行需求,常常引起客运服务的区域性供需矛盾。如何合理分配城市中车辆运力资源,实现客运服务按需供给成为近年来研究的热点。针对人群出行的特点,本文提出一种基于组合神经网络的
随着工业智能化的不断推进和换向器产能需求的不断提高,过去非常低效率的人工检测传统方法和存在各种局限性的传统数字特征处理检测方法将逐步退出工业缺陷检测界的主要舞台。近些年来,卷积神经网络经过长足的发展,分类、检测、分割的各个领域上都有了突破性进展。越来越多的神经网络框架被应用到各类物品的表面缺陷检测任务中。应用在表面缺陷检测的目标检测框架常常可以划分为一阶检测器和二阶检测器。二阶检测器中经典的网络框
由于在划分无标签且含有缺失实例的多视图数据上具备优势,不完整多视图聚类吸引了越来越多的研究关注。虽然已取得很大进展,大多现有不完整多视图聚类方法仍存在至少一个以下缺陷:(1)无法同时开发数据样本之间跨视图的共同关系及原始数据特征表示的互补多视图信息;(2)忽略视图之间高阶的相互关系;(3)只能处理诸如只有两个视图等特殊视图不完整情况。针对这些问题,本文主要开展了以下两方面研究:(1)为了同时挖掘数
互联网给用户带来丰富资源和便捷服务的同时,因其开放性和匿名性,也成为网络攻击的平台。在众多网络安全问题中,恶意网页扮演重要角色。如何实现对恶意网页的精准快速识别,已经成为一项迫切且具有挑战性的工作。目前,识别方法大致分为四类:基于黑名单技术的检测手段、基于启发式规则的检测方法、基于机器学习的检测方法以及基于蜜罐技术的检测手段。但已有方法都有各自的局限性,必须面向恶意网页检测手段进行更深层分析与探讨
随着信息技术的不断发展,网络安全问题层出不穷,网络攻击的方式也变得复杂多样。入侵检测系统具有主动防御的功能,能够对网络流量进行持续监控,提升了系统的安全性。近年来,随着机器学习技术的普及和计算力的大幅提升,大量基于机器学习的技术被应用于网络入侵检测领域,相较于传统的网络安全防御手段,更能适用于当今网络攻击复杂多样化的环境。但在大量的网络数据中入侵行为只占少数,数据分布不均衡,而且原始网络流量存在大