数据降维算法研究及其应用

来源 :湖北大学 | 被引量 : 0次 | 上传用户:connielihui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科学技术的迅速发展,高维数据大量出现在如计算机视觉、机器学习、生物信息以及航空航天等众多领域。高维数据不仅难以被人们直观理解,而且难以被现有机器学习和数据挖掘算法有效地处理。降维算法是处理这些高维数据的一个重要手段,也是特征提取的重要工具。虽然在数据降维处理方面已经有了大量的研究工作,但是在线性与非线性流形降维领域仍然存在许多具有挑战性的问题:如小样本问题,out of sample问题以及分类问题等。在2000年,《Science》上的三篇文章分别从神经科学与计算机科学的角度对降维问题进行了阐述,这不仅进一步促进了降维问题的研究,同时也推动流形学习成为当前机器学习研究中的一个热点问题。本文围绕数据降维算法及其应用展开研究,重点对线性的降维算法以及流形学习算法进行了研究,提出了一种新的无监督降维算法。论文的主要工作包含以下几个方面:(1)对传统的线性降维算法以及流形学习算法进行了深入研究和探讨,比较了它们之间的优缺点。(2)通过在仿真数据集上进行实验进一步说明各种降维算法间的不同,详细比较了各算法的计算复杂度以及内存需求。(3)提出了一种新的无监督降维算法,即鲁棒的基于局部以及全局结构的降维算法,该算法能够自适应地发现高维数据中的流形结构,同时对于参数的选择具有鲁棒性。与传统的流形学习算法不同的是,本文所提出的算法的识别性能不受近邻参数的影响。在三个广泛应用的人脸数据库上进行的人脸识别的实验展示了本文所提出的算法在人脸识别中的有效性。
其他文献
采用正交试验方法对炭黑在气力输送过程中影响破碎的因素进行了优化试验;通过试验数据分析得到了在双压送罐双管密相输送情况下,影响炭黑破碎率的各项因素的关系,依次为压送
混凝土条件温升试验是在达不到混凝土绝热温升试验条件时,利用保温隔热设备提供较稳定的外部环境,尽量减小混凝土试件与外界发生热交换的类绝热温升试验;条件温升试验无需专门设
10月19目,记者走进位于浙江省海盐县的秦山核电基地。据悉,秦山核电目前共有9台运行机组,总装机容量为656.4万千瓦,年发电量约5004L千瓦时,是目前中国最大的核电基地。
随着计算机技术的飞速发展及互联网的普及,近年来,信息系统发展迅速。从政府机关到企业,从科研单位到大专院校,从大型公司到个体经营,信息系统已经成为发展生产力的有力因素
在借鉴国内外先进经验的基础上,本研究以海城市二台子滨河公园景观设计为例,探讨和研究城市滨河景观如何以生态的手法进行规划和设计。主要研究内容与结果如下:1、对海城与场
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
通过两个案例介绍,对常见的弓网故障进行归类和原因分析,并结合实际工作,给出相应的防范措施,为现场实际作业提供了指导,同时也为故障抢修提供了依据。
期刊
页岩吸附气量是决定页岩气井开发价值和开发寿命的关键性参数,也是能否成功进行开发的重要参考因素。由于现有的适用于亚临界态的单分子层吸附的兰格缪尔等温吸附模型不适用
近年来,电力企业得以快速的发展,随着电力用户的增加,为了保证用户用电的安全,则用电检查工作变得越来越重要。用电检查作为电力企业日常工作中的重要内容,也是电力企业经济效益得