基于结构控制的多模态数据分析研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:fjsgxxs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网和自媒体的兴起使得互联网中的多媒体数据快速增加,人们对于爆炸式增长的、形态各异的数据应接不暇。如何建立一套自动化理解数据内容和分析数据关系的智能工具来帮助人们更好地利用网络多媒体数据资源成为重要问题,多媒体数据分析因而受到广泛关注。作为多媒体数据分析中两个基础任务,跨模态检索和多视角聚类旨在分析异构数据内容之间的关系,成为支撑下游应用的关键技术。本文从这两个方面入手,对多模态数据内容相关度建模、数据哈希编码结构控制、挖掘不完全观测多视角数据的结构信息等问题进行探究,并针对性地提出解决方案。本文主要内容可总结如下:提出一种感知类别间语义关联的跨模态哈希方法。首先,为了弥补现有方法的数据相关度度量在建模类间关系方面的缺陷,该方法为数据集的类集建立语义树,并提出一种基于语义树的数据相关度度量,以灵活的方式将类间关系纳入考虑;其次,为了充分利用类间关系引导哈希函数的学习,同时解决低相关度数据主导训练过程的问题,提出一项新的结构控制目标函数,能够充分利用整体可用的距离区间来分配检索数据,并将高相关和低相关数据对的训练过程进行分离,解决数据对相关度不均衡问题。为验证该方法的有效性,本文在三个常用数据集上,用三种不同的哈希码位长和两个方向的跨模态检索任务对其进行测试和分析,并和现有算法进行对比,实验结果验证了该方法的优异性。提出一种基于统计视角的非完整多视角聚类通用增强方法。针对现有非完整多视角聚类方法在不完全观测数据信息利用上的不足,首先基于数据模式的观测提出一个新的洞见,指出视角之间在分布层面的潜在对应关系;然后以统计视角对跨视角一致性进行描述,为利用不完全观测数据挖掘跨视角一致性提供技术可行性;最后,提出视角内平滑假设和一种跨视角对应数据组的构造方案,将分布层面的对应关系公式化为一项通用的目标函数,并给出两个基于已有模型的增强示例。本文在三个数据集上进行充分的实验和分析,结果表明,该方法能够对现有模型进行增强,使其能在高数据缺失率下保持更稳健的性能。
其他文献
随着社会工业智能化的发展,智能服务机器人已经走进大众的生活,在未来将会起到不可或缺的作用。抓取检测是机器人的一项主要能力,开发实用的抓取检测方法和技术是机器人研究领域的核心研究方向之一。然而,现有的抓取检测方法通常是基于无标签的外观形状特征进行检测,在其训练过程中固定了样本的类别和数量,模型只能学习到有限的知识,对于已学习过的样本表现出较好的泛化能力。然而由于在实际场景中,物体的形状、颜色和大小等
学位
在当今的环境监测工作中,废水监测是一项主要的工作内容,尤其是工业废水监测,更是对水环境污染的及时发现与治理至关重要。在发现了工业废水污染超标情况之后,相关单位也需要采取合理的技术措施进行工业废水处理,以此达到良好的污染治理效果。基于此,本文对环境监测废水以及工业废水处理技术进行了分析,包括环境监测分析工业废水的主要分类与特征、工业废水主要处理方法、工业废水处理技术实际应用。希望通过本次的分析,可以
期刊
我国自第一颗东方红卫星成功发射以来,至今已有400多颗在轨卫星,分别承担着科学探测、技术试验、导航定位、通信广播等重要任务。在对卫星故障的统计中,姿态控制系统故障占比最高,而动量轮作为其执行机构需要不间断地做旋转运动,更易发生故障。随着通信、大数据等技术的蓬勃发展,在轨运行卫星产生了海量的遥测数据。但截至目前的星上故障检测仍以专家系统或阈值法检测为主,具有依赖专家经验、及无法检测检测未知故障等缺点
学位
二图匹配是指通过最大化两个图之间的结构相似性得分,找到两个图之间的节点对应关系。该问题被广泛应用在计模式识别、信号处理、计算机视觉、计算机图形学和生物信息学等领域,具有广泛的理论价值的应用价值。不同于传统的点匹配问题,图匹配问题不仅要考虑点集之间的一致性,还要考虑二阶的边集之间的一致性,本质上是一种难以在多项式时间内求得全局最优解的二次组合优化问题。因此,大多图匹配算法通过对目标函数或约束条件进行
学位
近些年来随着互联网的发展,随之而来产生了大量的多媒体数据(例如,图片,文本和视频),这些数据通常都会被存储到数据库中,如何在这些数据库中找到人们所需要的语义相关联的信息变成了一个非常具有挑战性的任务。解决此类挑战性任务的方法是信息检索,而跨模态哈希检索作为信息检索的其中一个分支,具有计算速度快,存储效率高的特性,是解决大规模多媒体数据信息检索最有希望的手段。本文从跨模态哈希检索的三个子任务出发,结
学位
原油经过一定的炼制流程可以生成各种原油产品,作为“工业血液”在社会经济中具有广泛作用。随着各个国家对原油数量和品种的需求日益增加,同时全球生态环境面临的挑战形势愈发严峻。因此,对炼油企业的生产有了更加严格的要求,不仅要提高原油利用率和企业效益,而且还要满足节能、环保等需求。由于炼油过程中存在不确定、多目标和多约束等特性,原油短期生产计划与调度成为研究热点。由于该类问题的复杂性,目前缺乏有效的工具和
学位
现有的机器人抓取模型大多都是针对不透明的物体或折射和反射率较低的物体来进行指定的抓取任务,无法对日常生活中常见的透明物体实施有效的抓取,从而限制了机器人的应用和发展。对透明物体进行深度补全是赋予机器人抓取技能的重要方法。通过运用深度补全算法,可以对透明物体缺失深度信息的原始深度图进行有效的补全,将补全后的深度图运用到抓取模型中,使得机器人可以有效地感知到透明物体的大小和位置信息,从而实行对透明物体
学位
农药、植保机械与施药技术为植物化学保护的三大支柱,其中施药技术是连接农药学科和植保机械学科的关键环节,是农药从研发到田间应用的“最后一公里”。农药科学使用并不是一个简单的选择农药和施药量的药物学问题,而是涉及作物学、植物保护学、农业工程学、气象学等多学科交叉的系统工程。本文就农药雾滴雾化与运动特性、沉积与分布状态、流失与飘失行为,以及害虫行为与农药雾滴雾化运动和沉积分布关系等方面的研究进展展开综述
期刊
精确的环境感知系统是自动驾驶及机器人技术实现的关键,其中基于激光雷达点云数据的3D目标识别是视觉感知领域的重要任务。由于激光雷达点云数据的无序性、稀疏性、旋转性等特点,传统机器学习方法、聚类方法和卷积深度学习方法很难直接对雷达点云数据进行特征提取。本文基于现有研究提出了一种基于信息融合的3D目标识别算法,对当前的点云目标识别方法进行改进。首先,针对点云数据体素化带来的细节丢失问题,提出了一种体素预
学位
阿尔茨海默症(Alzheimer’s Disease,AD)是一类不可逆的大脑神经退行性疾病,其患病率随着年龄的升高呈显著增长趋势,被认为是导致死亡的第七大原因,目前仍然缺乏明确有效的生物标志物,只能通过早期干预延缓AD病情的发展。功能核磁共振影像(Functional Magnetic Resonance Imaging,fMRI)是研究脑部疾病的重要医学工具,可以观察大脑相关区域的功能变化,而
学位