【摘 要】
:
多视图分析能够较好地利用不同视图之间信息的兼容性和互补性,比单视图分析具有更好的决策性能,目前广泛应用于计算机视觉、目标检测、行为识别等领域。然而传统的多视图分析大多只研究成对视图间的关系,忽略了所有视图间关系,导致得到的公共空间判别性不强。尽管一些非成对多视图方法得到了判别性公共空间,却使用广义特征值分解方法对其近似求解,使得最终结果偏离全局最优解。因此,人们希望既能得到判别性公共空间,还能得到
【基金项目】
:
“陕西省重点研发计划项目(编号:2019GY-012)”面向无人机快递配送的定位系统;
论文部分内容阅读
多视图分析能够较好地利用不同视图之间信息的兼容性和互补性,比单视图分析具有更好的决策性能,目前广泛应用于计算机视觉、目标检测、行为识别等领域。然而传统的多视图分析大多只研究成对视图间的关系,忽略了所有视图间关系,导致得到的公共空间判别性不强。尽管一些非成对多视图方法得到了判别性公共空间,却使用广义特征值分解方法对其近似求解,使得最终结果偏离全局最优解。因此,人们希望既能得到判别性公共空间,还能得到全局最优解的多视图分析模型。本文重点研究了两种多视图学习方法:TRCMv DA模型解决多视图判别分析中的迹比(Trace Ratio,以下简称为TR)问题;HMMv DA解决一些多视图分析对所有的类间距离赋予相同权重,较小类间距离在公共空间上重叠的问题。主要工作如下:(1)提出基于迹比准则的多视图公共空间判别分析(TRCMv DA),该有监督模型同时研究了视图内和视图间的关系,得到判别性公共空间。针对多视图判别分析中的TR问题,我们提出一个可以放宽半正定矩阵约束条件的策略,使模型可以通过Newton-Raphson迭代方法求解。最后,该模型与7个多视图主流算法在5个常用公开数据集上进行对比实验,结果说明该模型解决了TR问题,且识别精度提升3%以上。(2)提出基于加权调和均值的多视图判别分析(HMMv DA),解决一些多视图算法对所有的类间距离赋予相同权重,造成较小类间距离在公共空间上发生重叠的问题。该有监督模型优先考虑成对类间距离,使所有类在公共空间上尽可能的区分开,得到更具判别性的公共空间。并且利用基于调和均值的类间散射矩阵增加了模型的鲁棒性,引入正则化参数平衡类内距离和类间距离对目标函数的影响,最后通过拉格朗日乘子法和KKT条件对模型进行迭代求解。实验证明,HMMv DA模型的识别精度略高于TRCMv DA,说明了本模型相比于后者可得到更具判别性的公共空间。本文提出的两个多视图监督学习模型,它们同时研究了视图内与视图间的关系,能够得到判别性较强的公共特征空间,并能求得全局最优解。最后,我们还成功地将两个模型应用于人脸识别和多模态人体动作识别并取得了良好的效果,证明模型具有较好的普适性。
其他文献
随着我国教育体制的改革,《普通高中数学课程标准(2017年版)》明确提出:数学教育承载着落实立德树人根本任务、发展素质教育的功能,高中数学课程面向的是全体学生,实现“人人都能获得良好的数学教育,不同的人在数学上得到不同的发展”。然而,每个班级总有一部分学生的数学学业成就普遍低于同年级的平均水平,数学学习困难,即使他们身处较好的学习环境,但自身在数学学习上的发展举步维艰,他们被称为“数困生”。因此,
壁画是我国文化遗产的重要组成部分。随着时间的流逝,受自然环境影响,古代壁画出现了多种多样的病害。病害标注是对壁画出现病害位置、大小的记录,是壁画状态调查和保护修复的基础,在保护文物中起着重要作用。颜料层脱落是壁画病害中较为典型的一种。目前,壁画的颜料层脱落病害标注主要通过人工标注或结合机器学习算法进行交互式标注,前者耗时耗力,后者准确度有待提高。同时,现有标记方法主要是基于人眼目视在一般数码相机采
文物体现了中华民族不同时期的发展与变化,是五千年以来人类劳动和智慧的结晶。但是由于风雨的侵蚀、地震的破坏、战争的损毁以及人类挖掘的损坏等因素,文物出现了不同程度的残缺。所以对文物进行数字化保护,能够在研究其历史价值和文化价值的同时,不再对其进行二次损坏。但是在数字化过程中,由于现有的基于扫描的和基于深度相机的数字化方法存在遮挡、人工误差、传感器分辨率限制等问题,文物会产生较大的残缺区域,所以对残缺
中国尤其陕西拥有丰富的古代绘画资源。这些古代绘画具有非常重要的艺术、科学和历史考古价值,但是它们现在生存状况十分堪忧,其中绝大部分绘画存在严重的病变、破损甚至消亡问题。破损的古代绘画严重影响了以绘画为代表的数字文化遗产鉴赏和传承效果。为了提高古代绘画数字化质量,本文将针对破损的低品质古代绘画图像,利用深度学习的理论与方法,研究对应的技术措施来重建高品质古代绘画图像。由于古代绘画图像结构复杂且样本数
习题预测任务是指利用学生历史答题数据预测学生未解答习题的正确性,它可以为学生呈现其知识掌握状态,方便学生查漏补缺;习题预测任务也可以帮助教师个性化教学,实现因材施教。本文将学生作答的习题分为“练习习题”与“考试习题”。“练习习题”是指学生平时学习过程中,为提高知识状态,自主练习的习题。“考试习题”是指在学期测验时,所有学生被要求在规定时间内完成考试所解答的习题。在学生自主学习过程中,由于“练习习题
在推动边疆民族地区高质量发展上闯出新路子在服务和融入新发展格局上展现新作为在推动绿色发展上迈出新步伐在巩固发展民族团结、社会稳定、边疆安宁上彰显新担当凝心聚力建设新时代中国特色社会主义壮美广西,是习近平总书记为新时代广西发展擘画的宏伟蓝图。我们把深刻领会“两个确立”的决定性意义切实转化为坚决做到“两个维护”的高度自觉,
鬼成像作为一种新型成像方式,利用了光场的二阶关联特性计算出目标图像。由于这一特性,与传统成像方式相比,它可以实现在雨雪雾霾等较差的光学环境中抗散射成像,且抗噪性强。因此,在一些特定场景下,鬼成像比传统成像更具优势。然而鬼成像普遍存在的问题是其成像质量与采样次数成正相关,高质量的成像效果意味着极大的时间成本,本文从原理出发,利用深度学习方法从两个方向优化了计算鬼成像系统的性能。首先,针对利用计算鬼成
人体姿态估计是研究定位图像或视频中人的关键点(关节点),并连接相邻关联关键点的技术。姿态多样、光照变化和环境遮挡等是影响人体姿态估计精度的主要因素。提高人体姿态估计质量在实践中有迫切的应用需要。本文重点围绕基于深度学习的复杂人体姿态估计问题展开研究。在深入研究现有基于深度学习的人体姿态估计方法的基础上,提出一个新的关键点关联约束的复杂人体姿态估计网络KACNet。该网络充分考虑了人体相邻关键点之间
自然语言处理技术诞生于上世纪50年代,随着时间的推移,先后经历了基于规则的方法、基于统计的方法以及近十五年来基于机器学习和深度学习方法的迭代更新,几年前伴随着BERT的呱呱坠地又掀起了一轮新的研究热潮。文本分类是自然语言处理中的一项重要任务,它的核心是从文本中抽取出能够体现文本特点的关键特征,寻找特征到类别之间的映射。近年来,另一种基于图结构数据的文本建模思想不断的发展壮大。与BERT不同,图神经
彩绘文物是宝贵的历史研究材料。线稿作为彩绘文物的重要组成,反映了文物图案的绘画结构,在文物修复和保护传承中具有重要作用。传统的线稿提取主要采用人工临摹的方式,不仅效率较低而且临摹准确度也因绘画水平不同有所差异。而基于图像处理的线稿提取方法可以高效且客观的提取线稿,具有广阔的应用前景。但是由于彩绘文物病害较多,图像背景复杂,现有方法提取效果还有较大的提升空间。近期深度学习在图像处理领域广受关注,取得