【摘 要】
:
随着数据获取技术的飞速发展,图像数据已呈现出复杂化和高维化的特点。虽然高维图像提高了图像识别等应用的性能,但是也增加了识别系统的处理和存储代价。因此,如何有效提取有用信息,以对高维数据进行维数约简是研究者们迫切需要解决的问题。其中,流形学习是一种广泛使用的特征提取方法,它通过局部结构保持来捕捉和释放隐藏在数据中的几何信息,具有良好的降维效果。局部对流形学习算法具有极其重要的作用,但是这类算法在高维
论文部分内容阅读
随着数据获取技术的飞速发展,图像数据已呈现出复杂化和高维化的特点。虽然高维图像提高了图像识别等应用的性能,但是也增加了识别系统的处理和存储代价。因此,如何有效提取有用信息,以对高维数据进行维数约简是研究者们迫切需要解决的问题。其中,流形学习是一种广泛使用的特征提取方法,它通过局部结构保持来捕捉和释放隐藏在数据中的几何信息,具有良好的降维效果。局部对流形学习算法具有极其重要的作用,但是这类算法在高维空间中定义局部会存在争议,特别是数据中存在大量噪声和冗余信息的情况下。由于无法在一个真正的低维流形中定义局部,一个可行的方法就是提高局部的置信度。为此,本文主要的研究内容如下:(1)从线性和非线性角度分析了一些典型的特征提取方法,包括这些算法的主要思想、推导过程及优缺点等。线性特征提取方法主要分析了主成分分析和线性判别分析,非线性特征提取方法分析了核主成分分析、核判别分析、局部保持投影、邻域保持嵌入。(2)为了改善流形学习算法的局部置信度问题,本文对局部进行了深入研究,总结归纳了关于局部的四个性质,提出了一种最近邻子空间保持的特征提取方法。首先,将数据中的每个样本点及其近邻视为一个局部,进而张成一个最近邻子空间;然后,利用格拉姆行列式对所有最近邻子空间的体积进行度量;最后,对体积做归一化处理,并集成到局部保持投影和邻域保持嵌入的函数模型中。(3)选取了一些真实的高维图像集进行实验,首先利用本文算法和其他特征提取算法对数据集进行降维,然后通过聚类和分类任务实验比较分析这些算法的低维表示能力,实验结果表明,本文算法提取的特征更具鉴别性。
其他文献
我国于2016年正式出台《上市公司股权激励管理办法》,进行激励的公司数量呈井喷状态,公司的治理能力和创新能力均有不同程度的提高。软件业作为重要的、基础性的行业,对员工进行股权激励逐渐呈现常态化的特点。连续多期的股权激励能否有效调动员工的积极性,提升企业的绩效,从而对公司治理产生积极的影响?因此,本文选择了软件业中,股权激励具有一定代表性和典型性的上海汉得信息技术股份有限公司,研究其股权激励的实施动
知识经济时代的产业形态从资本密集型转变为知识密集型,物质资本逐渐被智力资本取而代之。智力资本的稀缺性、难摹仿性等特性决定了它的高价值贡献率,也成为企业发展必不可少的关键元素和企业塑造核心竞争力的动力源。农工一体化企业契合中央促进农业一二三产业融合发展、延长农业产业链、提高农产品附加值的产业发展政策,工业的加入使得农业产业的科技含量大大提高。农工一体化企业全产业链的独特生产模式决定了需要更多的生产技
留守儿童问题是我国突出的社会问题之一,目前我国仍存在6000万左右的留守儿童群体,他们当中的大多数为父母双方或一方外出务工而留守在家的14岁以下儿童。这个年纪正是接受学校教育的年纪。因此,在当前形势下,提升对留守儿童心理以及文化知识的教育是非常重要的。本次毕业设计的微纪录片作品《星星“不回家”》就是围绕高邮市龙虬镇龙虬小学展开拍摄,通过采访该校校长、老师以及几位留守儿童来表达家庭教育以及父母陪伴对
《繡屏緣》是明末蘇庵主人的一部才子佳人世俗小說,全書共二十回,留存了大量當時流傳於民間的俗字字形。經整理,全書共有俗字797個,本文以此為研究對象,主要內容如下:緒論部分主要介紹了本文的研究對象、交代相關研究綜述、闡明研究方法及意義。第一章內容是對《繡屏緣》中俗字的介紹。本文借鑒諸位學者的觀點,提出俗字是一種民間群眾將正字按照約定俗成的自覺意識書寫並在社會各個方面廣泛使用的通俗字體,並按照時間順序
当前,我国全民体育事业蓬勃发展,体育基础设施的相继开放和免费使用,使得群众性体育活动日益增多,全民体育已然成为一种趋势,业余足球运动员作为非精英的体育文化群体日益壮大。业余足球运动员身体素质随着运动量的不断增加而日愈增强,但其心理机能水平方面所暴露的问题日愈显著,受到国内外运动心理学领域专家学者的日愈关注和研究。草根足球比赛广泛开展并且日愈受到更多业余足球运动员的欢迎,业余足球运动员积极参加各级各
脱产备考生是指已毕业并取得最高学历证明,选择不就业或离职,全身心投入研究生、公务员、事业单位等升学、就业或从业资格证考试的的社会人群。作为一类特殊考生群体,他们通常承受着超过应届大学生的压力,也有着更多的心理健康问题。近年来,受新冠肺炎疫情的影响,许多行业深受打击,新闻媒体报道“考研究生、考公务员热”频率不断增加,反映出除应届大学生外,有越来越多的人参加升学、就业考,在此社会现象引起关注和热议的同
滚动轴承作为现代工业系统中最为常用的零部件之一,其微小的故障有可能造成极大的经济损失和人身伤害。因此,对滚动轴承进行准确的故障诊断能够保障设备正常运行,具有重要的实际意义。由于故障数据获取的成本很高,滚动轴承的数据通常包含大量的正常数据,只有少量的故障数据,属于一类分类问题。为此,从支持向量数据描述(SVDD)方法出发,对SVDD算法进行深入研究。针对其在建模过程只考虑了数据自身相关性,而忽略了数
随着深度学习快速发展,神经网络的应用越来越广泛。随着部分关键领域对神经网络的安全需求不断提高,神经网络安全问题的研究就显得尤为重要。近年来,学者的研究表明通过在神经网络输入端加入扰动可以干扰整个神经网络的运行,然而这种输入端的干扰往往容易被察觉。本文着重关注神经网络模型的内部错误,也就是比特翻转错误。这种错误通常是由于外部环境变化,使原本在硬件平台上运行的神经网络模型权重出现比特翻转错误,从而影响
随着集成电路设计水平的不断发展,系统集成度不断提高,系统芯片(System-on-a-Chip,SoC)随之出现,电路结构的复杂度、集成度都提升到了一个新的阶段。但与之对应的是测试的数据量急剧增加、测试时间变长、测试功耗升高。而自动测试设备(Automatic Test Equipment,ATE)的内存深度和带宽有限,导致了测试的整体成本居高不下。若通过迭代升级设备来优化性能,将使测试成本进一步
高光谱遥感图像蕴藏了丰富的光谱、空间信息。由于成像仪器空间分辨率的限制以及复杂地面覆盖情况,高光谱图像中存在大量混合像元。混合像元极大影响了高光谱遥感在目标检测和精细分类等领域的应用。为提高高光谱遥感的实用性,混合像元分解成为高光谱图像分析领域的热点。高光谱解混能够通过分析像元中各类物质光谱特征的差异,识别提取端元信息,并计算各端元在像元中的占比,进而获取丰度信息。非负矩阵分解(Nonnegati