基于PCA的联合子空间理论与分类方法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:wanxlm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式分类是数据分析和处理中的核心问题,而对于高维数据进行分类时经常会遇到“维数灾难”。为了克服此困难,一种常用方法是先用主成分分析方法将特征空间降到低维的主成分子空间,即将任一样本投影到主成分子空间上,并采用概率模型(如高斯混合模型)对降维后的数据进行建模并得到各类样本的概率分布(条件概率分布)。最后对测试样本做同样的投影,计算其属于各类的概率密度,并根据贝叶斯决策规则进行分类。  由于主成分分析方法仅在主成分子空间中保留原数据的方差(或分布)信息,这种统一的PCA分类算法忽略了残差子空间(补子空间)的有关信息,在一定程度上限制了分类正确率的提高。为了克服此不足,Moghaddam&Pentland于1997年提出了基于高斯混合模型的联合子空间方法。它对每类数据进行PCA降维,并用投影数据在主成分子空间上服从的混合高斯分布密度与数据残差在残差子空间上所服从的球形高斯密度之乘积近似该类的概率密度函数。这样显著提高了实际分类的正确率。近年来,这种联合子空间方法越来越受到人们的重视,在参数估计和分类准则等方面得到了发展,并且在一些真实数据上取得了很好的分类效果。  在上述研究的基础上,本文将联合子空间方法规范化,提出了其成立的两个基本假设,另外从理论上证明了残差子空间上高斯密度函数的参数“代表特征根”的启发式取值正是该参数的极大似然估计。然后,本文在同一框架下,比较了逐分量联合子空间算法与一种EM算法的贝叶斯正则化方法,并阐述了两者的内在联系与前者的优势。本文进一步在新的混合模型、子空间分解等方面做了一些探索,提出了基于t混合模型、核主成分分析的联合子空间算法。通过分析模拟和真实数据上的实验结果,我们发现几种联合子空间算法几乎都取得了比统一的PCA分类算法更高的分类正确率,并有了更广的应用领域。本文还比较了它们之间的优劣关系并尝试给出理论解释。
其他文献
本文主要研究了具有周期系数的抛物型和椭圆型方程的多项式增长解空间的结构。  本文分四章.绪言中介绍了和本文相关的已知结果。  第一章介绍本文所需要的预备知识,主要
股指期货作为一种金融创新产品,主要是针对股票现货市场收益率的不确定而设计出的一种对风险进行控制的工具,在发挥套期保值、对冲风险的同时,也由于其高杠杆性、投机性、做空机
音乐是一门听觉的艺术,音乐欣赏是经过听觉而实现的审美教育活动.教师须用一些简单可行的方法调动学生的热情,让学生主动参与音乐,使学生真正成为审美活动的主体.给学生充分
本论文研究了有关广义相对论的两个问题,分别为de Sitter时空的负能量问题,以及Cauchy面中一类弱稳定的二维曲面的曲率估计问题。   以de Sitter时空为背景,罗民兴、谢纳庆和
R.Coifman、R.Rochberg和G.Weiss在研究BMO空间的刻画时首先引进了Calderón-Zygmund算子交换子的概念.这种算子在b为BMO函数的情况下,当1<p<∞时是Lp有界的,但当p=1时,不同于C
十六届四中全会把加强党的执政能力建设作为主题,审议通过了《中共中央关于加强党的执政能力建设的决定》,顺应了党心、民心,也顺应了历史的潮流,是我们党对治国理政的战略
拟群是一种类似于群的代数结构,拟群理论是组合设计理论中比较经典、未解决问题比较多的研究领域.近年来,拟群理论在计算机科学、编码理论和保密通讯等领域得到了重要的应用,
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
在这篇文章中,我们讨论了Erdos-Szekeres问题在允许三点共线条件下的推广,同时对n=5的情形作出猜测,并对凸包为四边形和三角形的一些情形给出了证明。  本文第一章主要陈述了
该文针对县域经济系统的特征,结合县经济系统的实际情况,对县域经济预警的理论与方法进行了探讨,对县域经济系统的警情、警源、警兆、警度进行了具体分析;建立了县域经济预警