降维技术计算量分析及基于DCT的复合降维技术研究

来源 :国防科技大学 | 被引量 : 2次 | 上传用户:asgtzyj_lxj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究高维数据降维的复合降维技术问题。降维技术是高维数据处理领域一个最为重要的研究方向,是一切高维数据处理的基本出发点。现有降维技术,在处理维数较低的高维数据时取得较好的进展,但对于超高维数据,由于计算量问题,这些方法往往显得无能为力。本文针对这种情况,主要研究内容有以下四个方面:1、分析总结了降维技术的现有方法体系在认真学习和理解各个时期的一些代表性的方法基础上,详细分析了PCA、PP、ICA、LDA等线性降维技术本质上的相通之处,认真总结了MDS、Isomap、LLE、LE等非线性降维技术的内涵。针对维数较高的情况,深入研究了不同方法计算复杂度和维数的关系;2、提出基于DCT的复合降维技术DCT的本质就是在保证变换后的数据拓扑空间不发生变化的前提下,把向量中均匀分布在各维的特征全部集中在前几维上,我们正是利用它的这点特性,把它用在数据降维的预处理过程上。这样做的好处有:(1)大幅度降低处理数据的维数,提高后续复合降维技术的速度;(2)在数据存在误差或数据点本身存在噪音的情况下,增加DCT过程可以对原数据结构进行一定程度的纠偏,进而提高降维技术的识别能力;3、提出了基于利用结构失真测度判断截取维数的方法在深入研究MDS方法中Stress函数控制原理的基础上,提出采用失真度曲线的拐点来估计截取维数的方法,取得了较好的效果;4、从理论上证明复合方法较传统的下采样方法更能保持原始数据的空间结构传统处理超高维数掘常用的手段为通过下采样方法降低样本的维数,我们从理论上证明,这样的处理手段较DCT方法对原数据空间结构破坏性更大。文中的实验结果表明,对于维数较高的数据处理,复合方法是一个非常有效的降维方法,该方法不仅在保持原数据空间结构的情况下大大降低了计算复杂度,而且,随着原数据的维数的增加,其效果越来越为明显。
其他文献
学位
学位
隐马氏模型的经典理论由Baum等人在20世纪60年代末给出。时至今日,模型结构已经由离散隐马氏模型,发展到连续隐马氏模型,以及本文中最新的多层隐马氏模型等等。本文研究了多层隐马氏模型的模型结构及算法,结合自动机的理论研究了隐马氏模型的模型结构同自动机的模型结构之间的联系,并在最后给出在模糊系统中的应用。本文的主要内容有以下几个方面:1.首先给出了多层隐马氏模型的前后向算法,并基于此给出了一种迭代算
代数攻击作为一种新的攻击方法对许多密码系统的安全性提出了挑战。它最初被用于公钥密码和分组密码的分析中,首次应用于流密码是在Courtois对Toyocrypt密码体制内部的相关特性分析中,随后代数攻击在流密码中也得到了广泛的应用。流密码由于其实现简单、加密速度快在军事、商业及其他领域中早已得到广泛应用。对流密码的攻击分析已有许多成熟的方法。本文首先介绍了流密码的各种攻击方法;并概括了基于流密码的代
本文以某"链篦机—回转窑"球团生产企业实施清洁生产审核为例,详细介绍了该企业实施清洁生产审核的程序、内容和要点,提出"链篦机—回转窑"球团生产行业在清洁生产、循环经济和节能环保技术与管理方面存在的问题和解决方案,为其它"链篦机—回转窑"球团生产企业推行清洁生产提供参考和借鉴。
循环码是一类重要的线性码。它具有严谨的代数结构,其性能易于分析;它还具有循环特性,编码译码易于实现,因此循环码格外引人注目。近年来,越来越多的学者开始致力于有限环上循环码的研究。有限环上的循环码研究具有重大的理论和实际意义:一方面,通过Gray映射,我们可以从某些有限环上的循环码得到性质较好的二进制码;另一方面,有限环上循环码的结构、性质以及各种参数的估计本身也是循环码理论的重要组成部分。纠错码的
学位
学位
代数几何码的构造与译码问题是当前编码领域研究的热点课题之一。有限域上代数曲线上的码的参数问题一直是代数几何码研究中的重点问题。我们在系统地总结了代数函数域,有限域上的代数曲线和代数几何码的基本知识的基础上,利用Weierstrass子半群理论,使用Homma和Kim的方法,讨论了Hermite曲线商域上码的维数问题,得到的主要结果如下:1.完全确定了Hermite曲线商域上一点码的维数。2.完全确