基于流形学习与子空间的降维方法研究与应用

来源 :东北师范大学 | 被引量 : 11次 | 上传用户:pridekao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的几十年内,数据采集能力的提高以及存储容量的增长,导致了科学研究的很多领域中信息量急剧增长,它向人们提供更加丰富、细致的信息的同时也造成了大量的信息冗余。在机器学习和模式识别领域的应用中,由于高维数据产生的维数灾难问题通常会影响传统算法的性能。维数灾难是指高维数据的估计需要的样本个数与维数构成指数增长的关系,但在实际应用中,通常样本点的数量较少而导致的高维数据空间的本征稀疏性。为了解决这一问题,维数约简通常作为数据预处理过程应用到数据分析以及机器学习的其它应用当中,以用来简化数据模型。 维数约简是将高维数据转换为有意义的低维表达的一种变换,在很多领域当中都具有举足轻重的作用,如模式分类、高维数据可视化、数据压缩等等。通过降维方法可以将高维数据投影到一个低维空间,从而找出隐藏在高维观测数据中有意义的低维结构。在该低维子空间中进行分类或聚类可以得到更精确的结果,且计算代价大大降低。 本文总结概括了各种常用的高维数据的降维方法及其分类。并且对这些方法进行了评估,指出存在的一些问题,提出了一种新的基于流形学习与子空间的降维方法(DRMS)。DRMS利用LLE算法保持同类的邻域几何结构不变,提取类间的判别特征,增大类间的距离,从而达到有效分类的目的。该方法寻求在描述高维数据集内在结构与高维数据集的可分性两种目标函数意义下的折中,将高维数据投影到一个最优的低维空间。 本文将DRMS算法应用到多模态生物认证系统中。选用了人脸图像和掌纹图像信息作为生物特征。选用了ORL和FERET人脸数据库以及PolyU掌纹数据库作为实验数据来源。通过进行大量的实验以及与其它降维方法进行对比,证明了DRMS算法的有效性及鲁棒性。
其他文献
随着计算机网络的飞速发展,各高校网络规模的扩大,计算机网络监管的问题日益突出,给机房管理带来了巨大的压力。与人工管理效率低下相比,自动的网络监控软件的越来越显示出其
当前,推荐方式通常被分为三类:基于内容的推荐方法,协同过滤推荐方法和混合推荐方法。基于内容的推荐是为客户推荐其以往偏爱的产品的相似产品。它没有考虑到用户反馈的信息
在计算机辅助设计和制造系统中,每种系统都有自己规定的数据格式。由于存在众多的数据格式,给产品模型的信息集成、共享和交流带来了巨大的障碍。因此旨在交换图形数据的格式
在网络信息时代,企业和机构都在通过internet寻找新的商机和新的业务开展途径。与此同时,他们必须确保公开信息的信息资产的安全。随着客户、员工、合作伙伴和供应商的数量不
随着现代社会的发展和人们安全意识的提高,越来越多的重要场合,如车站、机场、银行、政府部门、居民社区等,都需要对人的身份进行鉴别。生物特征识别是一种利用人的生理或行
伴随着网络的发展,文本分类技术成为信息处理领域中重要的研究方向,通常用于处理和组织大量文本数据。蒙古语在中国来说是少数民族语言,蒙古文信息处理发展较慢,但在民族文化
蒙古族现在所使用的文字有传统蒙古文、托忒蒙古文和新蒙文三种文字。目前这三种文字主要采用人工转写的方法来实现文字之间的转换。当今时代是高科技迅速发展的信息化时代,
云计算作为计算机行业新兴技术的一个重要组成部分,其运行性能的好坏直接影响到处理大规模问题的效率。对此,探求优化组合智能算法是目前云计算研究的重要任务,同时也具有相
随着生物信息学的发展,生命科学数据呈爆炸式增长,迫使人们寻求强有力的数据管理和分析工具。数据挖掘是目前最有效的数据分析手段,用于发现大量数据所隐含的各种规律。在生
秘密共享是信息安全和数据保密的重要手段,可有效防止重要信息和秘密数据的丢失、毁坏、被恶意修改或被不法分子利用等。(k,n)门限秘密共享具有良好的性质,成为秘密共享中最