特征表示学习中的信息挖掘策略研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yuan6391
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着传感器和计算机技术的发展,人们见证了信息的超载和数据特征的爆炸式增长。通常这些数据具有数千甚至数十万个维度,严重制约了现实视觉任务的计算效率。为了解决这一问题,学者们提出了许多特征表示方法来挖掘数据中真正有用的信息。本文立足特征表示学习领域,分别围绕子空间学习、多视角学习和小样本学习任务,研究具有更高识别率的分类算法。论文所取得的研究成果如下:首先,针对基于协作图的判别分析(CGDA)没有充分挖掘数据全局几何结构,忽视了类间抑制关系的问题,提出了一种基于完整表示的特征提取与多级子空间投影(Cr FESP)算法。Cr FESP在特征提取阶段提出了抑制表示的概念,将每个样本表示成其余所有不同类别样本的线性组合,并为每个样本构建了基于协作信息和抑制信息的完整表示信息,采用图嵌入框架将样本的局部协作信息加入到类内协作表示方阵,全局抑制信息加入到类间抑制表示方阵中,通过构建图拉普拉斯线性核方阵将特征提取和子空间投影融合成一个统一的框架。同时,针对投影子空间包含的新生成的特征信息和原空间投影后的少量冗余信息,设计了一种多级子空间投影方法,采用迭代求解的策略在子空间中继续挖掘新增特征信息的全局和局部几何结构。为解决完整表示信息随投影子空间层数加深而逐渐减少且会丢失大量有效信息的问题,Cr FESP提出了一种基于多级子空间的跳跃构图方法对子空间中的构图方式进行约束,提高在了在深层子空间中获取数据完整表示信息的稳定性。考虑到上述构图方法的计算效率会随着实际问题规模的增大而逐渐降低,提出了基于多图学习的快速Cr FESP算法(Cr FESP-F),在计算基于协作表示和抑制表示的完整表示的过程中,引入与之相关的拉普拉斯图,加强了对样本边缘信息的获取能力。为了降低抑制表示计算和多图学习带来的时间复杂度的增加,Cr FESP-F采用类与类之间抑制关系代替Cr FESP中样本与样本之间的抑制关系,提高了算法的计算效率。其次,针对传统的多视角学习方法无法同时考虑多个视角对信息,本文提出了基于特征表示和互相关信息的多视角网络(Mv FRCI-Net)。Mv FRCI-Net将特征表示学习引入到深度多视角网络中,并提出了基于多视角的协作表示的概念,将每个单视角样本数据表示成其余不同类视角的同类样本数据的线性组合。此外,为了增强不同视角之间信息的多样性和互补性,Mv FRCI-Net采用了多种交互信息(多视角协作表示类内散度矩阵和互相关矩阵)对各视角之间的相互关系进行描述,并分别使用一种交互网络提取两种深度交互信息,然后与单视角信息进行特征融合。该方法作为一个统一的框架,同时考虑了多视角信息在单视角、多视角和多视角对中的信息分布。最后,针对传统小样本学习方法采用图像级特征分类存在分类精度不高,特征提取不充分的问题,提出了基于融合特征表示空间深度局部描述子的深度最近邻神经网络(F-FRSD)。该方法将特征表示引入到小样本学习中。针对数据在原始空间存在冗余信息的问题,F-FRSD采用类抑制表示来描述不同类别之间的判别性,并通过图嵌入框架将数据“伪投影”至低维子空间。针对小样本特征稀缺的问题,FFRSD采用类线性核将数据样本映射到高维核空间中来为小样本数据提供更丰富、更灵活的表示。此外,F-FRSD改进了DN4采用“图像-类”度量的训练方式,提出了“特征空间-类”的度量方法,使用可学习的融合特征空间深度局部描述子取代了图像级局部描述子,提升了小样本任务的分类性能。
其他文献
环状铁氧体是一种广泛应用于扬声器、拾音器、微波炉、电视等电子产品中的非金属磁性材料,其生产过程中会产生掉块、直裂、圈裂、杂质、粘膜、油污等缺陷,严重影响产品质量。目前主要通过人工观察进行质检,检测效率低、成本高。论文设计了一种基于机器视觉的环状铁氧体外观缺陷检测分拣系统,旨在减轻质检工人的劳动强度,提高质检效率,降低生产成本。根据环状铁氧体的滚动特性和磨床立式滚出工件的特点,论文设计了借助工件重力
学位
如今,立体匹配和图像压缩是计算机视觉中的关键研究问题,并且由于对自动驾驶汽车和场景理解的巨大需求而备受关注。跨光谱立体匹配是克服多光谱图像对之间的光谱间隙和估计视差图的一个非常具有挑战性的问题。此外,图像压缩是影响后续计算机视觉任务的基础研究领域,其主要目的是通过编码器将未压缩的图像压缩成比特流,以实现高效的存储和传输。在本论文中,我们研究了基于深度学习的跨光谱立体匹配和学习图像压缩。本文的主要工
学位
在室内自主定位领域,虽然目前已经有多种定位方式可供选择,但视觉SLAM因其成本低、可视化强、理论成熟等优势而备受欢迎,活跃在各种应用场合,极具潜力的移动机器人市场更是催生了各种令人惊羡的视觉SLAM算法。其中,ORB_SLAM2算法在基于特征点法的一类视觉SLAM算法中,具有里程碑意义。本文以ORB_SLAM2算法为理论基础,对室内自主定位方法进行探索和研究。首先,为了使视觉SLAM算法在图像发生
学位
传统机器人由于结构限制难以在狭窄非结构化环境执行预设任务,而连续体机器人相对于传统机器人其构型拥有无限冗余特性。无限冗余特性使得连续体机器人在拥塞的环境中有着极佳的柔顺适应性,其柔顺特性使其在狭窄拥塞的非结构化环境中彰显出广阔的应用前景。但无限冗余特性也给连续体机器人建模、跟踪控制带来了巨大挑战。本文以多段连续体机器人为研究对象,通过仿真与实验对其运动学和跟踪控制展开相关研究,主要工作如下:为了描
学位
近年来,数字化多媒体技术发展迅速,用户对数字化的图像和视频的需求量呈爆炸式增长。但是图像和视频的信息量相比于文本十分巨大,传输和存储需要大量的网络带宽和存储空间,因此需要对其进行数据压缩。目前,大多数的国际通用图像和视频压缩标准采用基于分块的DCT变化压缩编码技术。尽管这种技术可以提供相对接近原图的图像和视频,但其不可避免的会产生压缩伪影,包括块效应,带状效应和振铃效应。这些压缩伪影不仅影响用户的
学位
近年来,随着深度学习理论的兴起,计算机视觉的各个领域都得到了充分的发展。多目标跟踪技术作为计算机视觉中重要的组成部分,在这次深度学习浪潮中获得了长足的进步。由于多目标跟踪在军事、刑侦、商业分析等多个领域有重要的作用,因而对其研究有着重要的价值。相较传统方法,目前主流的基于深度学习的多目标跟踪算法已经有了显著的进步,但是人们对多目标跟踪算法提出了更高的要求,如实时高效跟踪、拥挤场景跟踪等。现有的跟踪
学位
随着电子信息技术的迅速发展,人们对光的认知不断地加深,不同波段光信息的获取变得尤为重要,通过光电传感器的数据采集与传输系统是获取光信息的重要手段。目前,大多数的数据采集系统可采集的通道数量有限且系统的功能也比较单一,难以根据光电传感器通道的数量进行灵活地扩展和系统升级。因此,本文根据多通道光电探测器阵列实际需求,研究探测器阵列、模拟信号调理模块、数据采集模块、信号处理模块与传输接口模块等结构及其相
学位
视觉目标跟踪是计算机视觉领域的一项经典研究课题,在视频监控、自动驾驶和人机交互等方面应用广泛。尽管对于目标跟踪的研究取得了很大进展,但单模态信息的局限性和不确定性影响跟踪效果,如可见光成像受光照、雨、烟和霾等环境条件的影响较大,红外成像虽受环境影响小,但其成像机理导致红外图像分辨率较低、纹理少,在热交叉条件下目标与背景难区分等。基于可见光和热红外(RGB/Thermal,RGBT)的双模视觉跟踪器
学位
随着机器学习、深度学习技术的进一步发展,基于表示学习的分类算法性能有了很明显的提升,但基于表示关系的算法大多仅通过原始样本的直接关系进行建模,而如何在子空间或表示空间也能够保持原始数据的相似性关系和空间结构,是提升表示学习模型性能的关键。本文立足于表示学习中的子空间学习、字典学习和深度字典学习,研究具有更高识别精度的表示算法。所取得的研究成果如下:(1)针对子空间学习算法或未能考虑样本的类标信息,
学位
肺癌是人类最常见的恶性肿瘤之一,同时也是全球癌症相关死亡的主要原因,每年导致大约180万人死亡,其中肺腺癌是一种最常见的肺癌组织学类型。近年来,尽管针对一些致癌驱动因素的靶向治疗以及针对免疫检查点的免疫疗法取得了显著的临床成功,但是仍然有很大比例的肺腺癌患者无法进行靶向治疗,而且还经常观察到对靶向治疗的耐药性。此外,免疫疗法的功效也仅限于某些患者,且在个体之间存在显著的差异。肺腺癌是一个动态的进展
学位