【摘 要】
:
随着大数据时代的到来,物联网、云计算、人工智能等新兴技术蓬勃发展,信息技术的革新不仅给人类生活提供了便利,也造成了数据的复杂多样。若直接对原始数据进行分析和处理已变得不太现实,一方面高维数据信息混杂,无法直接进行数据分析;另一方面数据维度空间的膨胀问题愈发严重。因此,针对高维数据的研究已成为一个重要课题。降维作为一个预处理阶段来挖掘隐藏在输入数据中的有用信息,可以有效地去除冗余数据,降低数据复杂度
论文部分内容阅读
随着大数据时代的到来,物联网、云计算、人工智能等新兴技术蓬勃发展,信息技术的革新不仅给人类生活提供了便利,也造成了数据的复杂多样。若直接对原始数据进行分析和处理已变得不太现实,一方面高维数据信息混杂,无法直接进行数据分析;另一方面数据维度空间的膨胀问题愈发严重。因此,针对高维数据的研究已成为一个重要课题。降维作为一个预处理阶段来挖掘隐藏在输入数据中的有用信息,可以有效地去除冗余数据,降低数据复杂度,提高分类性能。本文从提升特征的表达能力和提高投影矩阵的可解释性出发,找出最具有鉴别性的特征以提高识别精度。论文的主要工作包括以下几个方面:1.针对现有基于投影的特征提取方法在投影过程中缺乏可解释性的问题。本文利用L2,1范数对投影矩阵进行正则化,使投影矩阵具有行稀疏性,进而使得投影矩阵可以在选择具有鉴别性特征的同时具有良好的可解释性;另一方面抑制不相关或者冗余特征。因此,目标函数实现了同时进行特征选择和特征提取。2.针对数据表示不当会增加模型所需的时间和空间,包含一些不必要的冗余和噪声的问题。引入块对角表示(BDR)正则项直接追求块对角表示,从而提高聚类与分类等模式识别任务的精度。同时,因自表达善于挖掘样本或特征之间的相关性,使其能有效地引导进行无监督特征提取。本文提出一种基于自表达的无监督特征提取方法(Block Diagonal Projection,BDP),以自表达作为基本框架将特征选择、特征提取和块对角表示学习统一到一个模型。3.通过在不同的人脸数据集进行测试,本文算法相较于对比算法平均提升了约2%~5%。为增加实验的丰富性,在口语数据集Isolet和文本数据集Inosphere上进行对比实验,结果表明本文模型亦取得了至少2%的精度提升。进一步证明了BDP算法在线性降维和分类上的有效性。最后,基于BDP算法实现了一个人脸识别系统。通过对不同条件下的人脸的匹配,验证了BDP算法的有效性及应用性。从侧面也证明了本次研究对高维数据的分析和现实应用具有十分重要的意义。
其他文献
目的 分析2型糖尿病(T2DM)合并原发性高血压(EH)患者颈动脉粥样硬化与三酰甘油葡萄糖(TyG)指数、颈股脉搏波传导速度(cfPWV)、踝肱指数(ABI)的关系。方法 回顾性选取2019年1月至2020年3月广西医科大学第一附属医院收治的T2DM合并EH患者240例为研究对象。根据颈动脉超声检查结果,将患者分为颈动脉粥样硬化组[颈动脉内膜中层厚度(CIMT)≥1.0 mm,159例]和非颈动脉
<正>地坑院又叫做天井窑院,是古代人们穴居生存方式的遗留,被称为中国北方的"地下四合院",距今已有约2000年的历史。如今"穴居"地坑院在河南省三门峡市境内保存较好,特别是陕县西张村镇的庙上村,据说有"进村不见房,闻声不见人"的奇妙景象,其中较早的院子有200多年的历史,住了六代人。地坑院最早修造于何时,已无从可考。《易·系辞》中说,"上古穴居而野处",《礼记·礼运》中则提到"昔者先王未有宫室,冬
WIA-PA协议作为重要的工业无线网络协议之一,研究针对WIA-PA协议的漏洞检测方法对于工业控制系统的安全稳定运行具有重要意义。模糊测试技术是一种有效的漏洞检测技术,现有的模糊测试方法在对WIA-PA协议进行测试时存在测试数据冗余,漏洞检测效率低等问题。为此,本文针对WIA-PA协议开展模糊测试方法的研究,本文的主要研究内容如下:首先,针对现有模糊测试方法测试数据冗余,漏洞检测效率低等问题,本文
<正>1引言本文围绕着“生活中的三角函数”这一主题,以数学建模流程为主线,谈谈高中数学建模教学的设计.本次教学共两个课时,包含两个具有阶梯性的数学建模活动,其中第一个活动指向数学建模素养的水平二,第二个活动指向数学建模素养的水平三(水平的划分和课程标准一致).首先,根据潮汐曲线图的特征,教师引导学生选择三角函数模型进行拟合,让学生体验数学建模的过程,用数学的语言表达世界.随后,教师通过学生活动,
伴随着国家持续推进智慧社区建设,使社区信息系统的发展步入正轨,但大多社区信息化的系统孤立导致了各个系统间仍存在诸多问题,其中包括社区文件的难以共享、系统的修复以及管理成本高、系统读取数据慢等问题。目前智慧社区的文件系统仍不够完善,所以针对Ceph系统缓存策略以及数据修复的策略进行了改进。本课题主要工作如下:1.针对Ceph分布式系统缓存社区文件命中率不高的问题,本课题通过分析Ceph分布式缓存原理
自主驾驶车辆是一类可以感知工况、规划行驶轨迹并进行轨迹跟踪的移动机器人,现阶段自主驾驶技术的发展因两点需求越来越引人注意,一是降低交通事故的频发性,二是增加交通的有序性以方便智能交通网络的建立。本文借助模型预测控制在处理物理约束和高阶时变系统时的优势,采用李雅普诺夫稳定性理论和Schur补引理等辅助工具系统性地研究了自主驾驶车辆在现实生活中可能遇到的三类问题,这三类问题分别为给定轨迹跟踪、主动转向
现实生活中,由于利用成像设备直接获取或改变图像的质量往往需要投入大量的财力,因此人们为了能够获取高质量的图像,相继提出了很多有关图像重建和图像去噪的技术和算法,为图像的重建等技术奠定了坚实基础。现代以来,随着图像数学理论的深入研究,人们发现将分数阶微积分理论引入到基于偏微分方程的图像重建过程中可以很好地消除重建过程中噪声和阶梯效应的影响,这也极大促进了偏微分方程的研究与发展。本文主要在分数阶图像超
可控攀爬机器人在林业、军事侦察、大型基础设施(如高空路桥、桁架)的健康监测领域具有极其重要的意义。与无人机相比,攀爬机器人具有负载能力强、续航时间长等优点,能够贴近建筑表面进行近距离检测作业。传统攀爬机器人多为刚性结构,以磁吸式、真空吸附式、爪刺式为主。近几年,通过对尺蠖等生物运动行为及黏附机理的研究,基于智能黏附材料的仿生软体攀爬机器人受到学术界的关注。然而,传统攀爬机器人普遍存在体积笨重、壁面
<正>1978年,Louise Brown的出生表示辅助生殖技术(assisted reproductive technologies,ART)的范围已大大拓宽[1]。虽然胚胎和精子冷冻保存都已经是较为成熟的技术,但因为技术问题和较低的成功率,卵母细胞冷冻领域在很长时间内缺乏进展[2],1980年代后期,首次使用慢速冷冻和快速解冻冷冻保存技术,冷冻卵母细胞才首次成功受孕[3-4]。因为卵母细胞的表
摩擦磨损现象在工业生产中不可避免,其带来的损耗已经对人们的经济生活造成了巨大的损失。为此,学者们提出了不同的摩擦调控手段,如添加润滑剂等,并且取得了极大的进展。然而,传统的摩擦调控手段只能实现增大摩擦力或者减小摩擦力,无法做到在线的、可逆的实时调控。这在一定程度上阻碍了智能设备的发展。如何实现对摩擦的主动调控成为一个关键问题。磁敏橡胶因其具有良好的磁场可控特性,在磁场的作用下,其刚度、模量将发生改