数据降维技术的建模研究与应用

被引量 : 0次 | 上传用户：yh124712

【摘要】

：

特征降维是模式识别领域对高维数据分析的重要预处理步骤之一。在信息时代的科学研究中,不可避免的会遇到大量的高维数据,如人脸检测与识别、文本分类和微阵列数据基因选择等

【作者】

：

申中华

【发表日期】

：

2008年期

【关键词】

：

维数灾难特征降维特征选择特征提取支持向量机有监督的局部保留准则

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

特征降维是模式识别领域对高维数据分析的重要预处理步骤之一。在信息时代的科学研究中,不可避免的会遇到大量的高维数据,如人脸检测与识别、文本分类和微阵列数据基因选择等。在实际应用中,为了避免所谓的维数灾难问题,根据某些性质,将高维数据表示的观测点模拟成低维空间中的数据点,这一过程即为特征降维过程。总的来说,降维的目的是在保留数据的大部分内在信息的同时将高维空间的数据样本嵌入到一个相对低维的空间,而降维技术又可以分为“特征提取”和“特征选择”。经过适当的降维后,诸如可视化、分类等工作可以在低维空间中方便的实现。本文研究目的是为了探索新的有监督特征降维方法,并提出了一种基于支持向量机(SVM)的特征选择方法和一组基于有监督局部保留准则的特征降维算法。文中简要介绍了特征降维的准则,回顾了当前的主要特征降维技术,如主成分分析(PCA)、Fisher线性判别分析(FLDA)和最近的基于流形的特征提取方法以及相关的特征选择算法。本论文重点是:(一)建立了一种改进的基于支持向量机(SVM)的特征选择算法,阐述了应用该算法进行特征选择的原理和方法;(二)建立了有监督的局部保留准则,阐述了应用该准则进行特征提取与特征选择的原理和方法。针对基于支持向量机(SVM)的特征选择问题,文中充分利用SVM的最大间隔特性,利用支持向量和核函数来对特征进行排序和选择。而对于基于有监督的局部保留准则的特征降维,文中在详细分析无监督的局部保留准则利弊的基础上,提出了保留类内局部结构的同时最大化类内分离度的降维准则,并分别应用于特征提取和特征选择。论文最后采用MATLAB来编程实现了文中提出的算法,选取了大量的数据集来进行实验。大量的实验结果都表明,本文提出的方法是有效的、可行的,并且与现有的一些特征降维方法相比,更为有效。

其他文献

改善酱油风味的微生物及工艺研究

酱油的生产涉及到多种有益微生物的联合协同作用。其中最重要的是乳酸菌和酵母菌,他们的主要作用是发酵糖类产生小分子醇、醛、酸、酯、酚类等风味物质,这是酱油风味产生的主

学位

酱油乳酸菌酵母菌挥发性风味化合物发酵工艺

现代战场防御资源优化分配方法研究

未来战争是陆、海、空、电、天等多维一体的信息化、数字化战争。近几年来雷达组网成为各国作战系统不可或缺的架构之一,怎样合理分配雷达才能实时准确地发现及监视目标是各

学位

雷达组网雷达目标优化分配分解协调法目标威胁评估灰色局势决策武器目标优化分配协同作战

花生秧栽平菇高产新技术

期刊

玉米面

适应老龄化社会的家用产品通用设计研究

工业设计属于对现代工业产品、产品结构、产业结构进行规划、设计、不断创新的专业,其核心是以“人”为中心,设计创造的成果,要能充分适应、满足“人”的需求。我们的社会正

学位

老年人通用设计产品人口老龄化

关于中国品牌文化的提升探索研究

当今社会是竞争的社会,全球经济正处于激烈竞争当中,在这种商品极为丰富,差异性不明显的市场条件下,所有企业都在思考如何扩大品牌的差异性,树立自身产品的特色以区别于竞争

学位

文化品牌文化品牌设计心理核心竞争力品牌提升

地域文化在中原特产包装设计中的应用研究

本文致力于地域文化在中原特产包装设计中运用的理论和实践研究。首先从包装设计的发展历程、定义及功能的阐述;了解中原地域文化特点,分析其产生原因;结合国内外包装设计中

学位

地域文化中原特产包装环保经济效益

硫酸钙晶须造纸填料制备及应用新技术研发成功

<正>以长沙理工大学王玉珑博士为首的研发团队成功开发出硫酸钙晶须造纸加填应用新技术,解决了硫酸钙晶须用作造纸填料时存在的溶解度高,纸机网部留着率低,白水系统中钙离子

期刊

硫酸钙晶须留着率技术研发制备及应用

基于无线传感器网络的温室监测系统的设计与研究

无线传感器网络作为一种全新的信息获取和处理技术,被认为是21世纪的一项挑战性科研课题。论文针对传统温室监测系统采用有线传输方式容易存在成本高、移动性差、扩展不方便

学位

无线传感器网络温室监测多跳

《山东体育科技》介绍

<正>《山东体育科技》是由山东省体育局主管、山东体育科学学会和山东省体育科学研究中心主办并公开发行的体育科技期刊,系全国中文体育类核心期刊。国内统一刊号为CN37-1011

期刊

《山东体育科技》山东省体育局体育科学研究体育社会科学

毛纺印染综合废水处理工程

针对毛纺印染废水特点,采用了厌氧流化床-生物接触氧化法进行处理。运行结果表明,在进水COD平均为1700mg·L-1、BOD5450mg·L-1、色度300倍的条件下,上述指标去除率分别为95%

期刊

厌氧流化床接触氧化法印染毛纺

数据降维技术的建模研究与应用

与本文相关的学术论文