基于自适应加权的多类线性判别分析降维算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:muzhe8835
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,越来越多的应用会采集并使用大量的高维数据来解决某些问题。数据的维度越高,所包含的信息量就越大,会方便我们使用和挖掘数据信息。但与此同时,高维的特征空间会给数据处理带来诸多不便,例如计算复杂、存储量增加等等,甚至会因为信息冗余使实验结果不理想。应对此"维度灾难"带来的诸多问题,降维算法变得尤为重要。降维算法是一种将高维数据降为低维数据的方法,通过该方法得到的数据在低维空间中既保留了主要的特征信息,又去除了冗余信息,提高了数据有效性,是一种非常经典的机器学习方法。传统的数据降维算法有线性判别分析(LDA)和主成分分析(PCA)等,这些经典方法自提出以来被不断地研究,发现其缺陷和不足,提出新的改进思路,使降维技术更加精湛有效。本文主要针对LDA算法的缺陷,对于多类降维问题做了相应的研究与改进。LDA算法的目标函数过于依赖大距离的类间距,使得小距离的类间距会被忽略,导致投影空间的类与类之间重叠增加。本文的算法主要解决此类问题。本文的主要贡献点有:(1)本文提出一种基于柯西不等式的自适应加权多类线性判别分析算法,该算法在传统的线性判别分析算法的基础上采用类对的距离计量方式,并用自适应加权的方法解决LDA在多类问题中的重叠问题。(2)本文提出一种基于概率矩阵的自适应加权多类线性判别分析方法,该方法对每个类对分别计算类间散度矩阵和类内散度矩阵,并对每个类对的概率参数进行加权,通过自适应加权使得投影空间中的类间距尽可能相等。相比于基于柯西不等式的自适应加权多类线性判别分析算法,该方法增加了正则化项作为惩罚项,通过参数调节使模型更优。
其他文献
近年来,大规模语义数据Linked Data数据量呈现爆炸式的增长,其中生物医学数据集占据了相当大的比例。由于这些数据集分散且仅提供了有限的查询功能,没有充分出挖掘数据集中的有
航迹起始问题是指在杂波环境和噪声背景中,对目标尚未形成稳定跟踪之前的航迹确立过程。作为一种典型的多目标检测技术,航迹起始是多目标跟踪的基础,在各种交通管制系统、定
掌纹识别是一种新兴的生物识别技术,以其稳定性、唯一性等特点成为业界关注的热点之一,现己应用于身份识别与用户验证。掌纹识别技术包括掌纹图像采集与预处理、特征提取、特
域间路由协议是自治系统边界路由器交换路由信息时使用的协议,BGP是域间路由事实上的标准协议,其安全性关系到整个网络的安全。目前对于BGP安全性的研究主要包括两个方面,一是采
本文主要分析了新一代视频压缩编码标准H.264中的运动估计算法,并特别针对运动估计算法中的经典算法--整像素UMHexagonS算法进行了研究与改进。经过对整像素UMHexagonS搜索算
社会网络是指社会个体成员之间互动形成的相对稳定的网络体系。社团发现和协同过滤推荐技术都是社会网络中重要的研究热点。其中,社团发现技术有助于揭示社会网络中的普遍规律
果蝇优化算法(Fruit Fly Optimization Algorithm,FOA)是基于果蝇觅食行为演化出的一种新的寻求全局优化的进化算法。首先通过果蝇所在的位置去不断的计算其相应的味道浓度判
增强现实(AugmentedReality)是在虚拟现实基础上发展延伸而来的一门新技术,近年来已经成为研究的热点。增强现实首先利用计算机生成特定的虚拟信息,然后通过三维注册技术将虚拟
近年来,随着互联网技术的迅猛发展,Web服务作为面向服务架构的关键技术,越来越多的受到人们的关注。其中,Web服务发现作为实现Web服务正确、灵活的交互以及Web服务动态组合的
在服务计算(SOC)的风范下,分布在Internet上的各种异构资源都可以封装成服务的形式发布出去,供他人共享。Web服务技术顺应了这种计算风范,通过Web服务的组合,可以高效的实现资源的