核支持向量机中基于核函数的充分降维

来源 :云南财经大学 | 被引量 : 0次 | 上传用户:loongzhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究如何通过充分降维对核支持向量机(Kernelized Support Vector Machine)进行改进。在机器学习领域中,支持向量机(Support Vector Machines,SVM)是一种重要的分类器。核支持向量机则是为了应对复杂分类问题而对支持向量机的改进,其主要思路是通过映射函数对原特征进行改变或增维。在核支持向量机中,核函数起着重要作用。根据核函数,可以基于原样本点的取值直接计算Gram矩阵,以刻画增维后的样本点之间的位置关系,而不需要给出增补特征的样本取值,这意味着,如果需要的话,可以将特征增广到无穷维。然而,特征的增补并非越多越好,如果增补的特征中存在大量对于分类结果并不有效的信息,那么真正有效的特征作用反而会被冲淡。因此,本文针对增维后的特征再进行降维,以此减少冗余信息,收集有效特征信息并优化模型。考虑到上述降维是在非参数环境下进行,我们选择从充分降维出发设计该问题中的降维方法。具体而言,我们选择从累计平均估计(Cumulative Mean Estimation,CUME)方法出发。累计平均估计所基于的分布加权思想在信息的充分利用方面独具优势,而如前所述,我们所要面对的问题本质上可能会是无穷维向量的降维,这就是我们选择累计平均估计作为出发点的理由。基于累计平均估计(CUME),本文提出了核累计平均估计K-CUME,(Kernel Cumulative Mean Estimation)充分降维方法。其主要原理是,基于核函数与增维后特征之间的关系,通过内积运算,将CUME对增维后特征的降维转化为对Gram矩阵的操作,从而回避了对增维后的无限维特征的直接处理。基于上述思路,本文给出了完整的K-CUME算法。文中通过对一个环状高噪声模拟数据集的分析和一个真实的葡萄酒数据集研究验证了K-CUME算法的效果。
其他文献
竞争是生物界的主旋律,有成千上万的生物在自然界里生活和互动,形成了一个非常复杂的生态系统。物竞天择,适者生存,物种的行为策略永远围绕着“生存”这一永恒主题,它们在生存过程中所产生的光怪陆离的行为充满了趣味性与拟人性,具有很深的探索意义。当前全球正在面临着生物多样性锐减的危机,大量的物种濒临灭绝,倘若生物多样性持续下降,人类的生存最终也将受到威胁。因此,研究这些生态系统复杂的行为对于理解大自然,保护
学位
支持向量机是一种有监督的机器学习方法,通过寻找最大间隔超平面,用于解决二分类问题。双子支持向量机是在支持向量机的思想基础上发展而来,其主要思想是,寻找一对非平行的超平面,使每一个超平面接近一类而远离另外一类,通过样本点到两个超平面距离的远近来判断类别。支持向量机和双子支持向量机目前还存在一些局限性。从模型预测结果来看,在解决大样本任务或处理高维度数据时,效果没有神经网络那么理想。从计算效率的角度看
学位
朴素贝叶斯(naive Bayes,NB)是一种经典的机器学习方法,具有优异的分类精确度以及对噪声的稳健性。朴素贝叶斯经典算法基于两大理论,其一是贝叶斯定理,即后验概率依据先验概率和联合概率而得出;其二是特征条件独立的假设,即假设特征之间是相互独立的,联合概率的计算依据这一假设由特征的条件概率连乘而得。但是,由于其基于特征条件独立的强假设在实际应用中是不可能成立的,因此在一定程度上,限制了朴素贝叶
学位
医疗行业与人类的生命健康息息相关。特别地,新冠疫情的蔓延,国民生命安全意识的提高,推进了医学研究的发展。在医疗卫生领域中,单一评价指标无法对患者进行全方位考核。跟踪了解病人生存状态,统计一段时期内患者的生命体征,确定诊断的具体方案,是医学行业的现状。预后是医学研究关注的重点,通过分析观测数据,临床医生可以制定治疗方案,患者可以认清自身疾病状况。预后对临床医学影响深远。生存分析是医学领域常用的分析方
学位
进入21世纪以来,中国经济取得一系列令人瞩目成就的同时,资源过度消耗和环境污染等问题也日益严重。面对日益严峻的生态环境形势,推动高质量发展要求我们深入转变经济发展方式,改变原有经济考核制度,将资源消耗和环境污染一同纳入经济发展评价体系。在此背景下,绿色全要素生产率的概念应运而生。作为重要的外源动力,外商直接投资(Foreign Direct Investment,FDI)对绿色全要素生产率的影响不
学位
随着计算机性能和算力的提升,使得具有便捷性、精确性、迅速性和智能化等优点的机器视觉技术应用于工业生产的各个领域成为重要的研究方向。烟丝生产过程中的杂质检测和剔除是保障烟草产品质量的重要环节,将机器视觉的相关技术应用于烟丝除杂任务,可以有效缓解生产过程中对人工的依赖,在降低人工成本的同时,提高产品生产的自动化水平。烟丝除杂,重在检测。近年来,已有研究者对产品生产过程中的杂质检测方法进行了研究,但是对
学位
作为遏制流行病最有效的手段之一,接种疫苗在各个国家和地区中受到广泛采用。如何在提高接种水平的同时降低社会总成本是大家关注的重要命题。而个体做决定通常会比较自身收益和学习对象的收益,只有感觉到获益才会继续上一阶段决策,否则就会改变策略。我们关注如何使个体在做决策时倾向于更有利于全社会的方向问题展开研究。因此,本文设计两种领域扩展模型,通过扩展领域来分析如何达到整体患病规模较小且社会总成本最低,即社会
学位
身份认证在互联网上对确保信息安全和建立信任关系至关重要。随着互联网技术的发展,基于网络的安全应用越来越多,如电子商务,电子政务等,从而对网络环境下的用户身份认证提出了更高要求。但传统身份认证系统中存在的缺点,已不能适应当前社会发展的需求,需要通过灵活应用技术进行创新和扩展。此外,由于用户之间缺乏有效的身份验证机制,导致很多用户在使用云计算平台时无法得到可信第三方的支持,从而产生了严重的信任危机。随
学位
新型城镇化与生态环境的协调发展是走中国特色城镇化道路不可或缺的前提条件。新时期新型城镇化与生态环境协调发展的主要内容是合理配置资源,注重环境保护,推进以人为本的新型城镇化。现有研究的一致结论是,中国新型城镇化与生态环境的总体发展趋于协调状态。但由于受宏观经济形势、区域产业结构和生态环境等因素的影响,新型城镇化和生态环境发展不平衡不充分问题仍然突出。由于各地区新型城镇化与生态环境统筹发展的特点,统筹
学位
肝癌较高的死亡率与其确诊时间有很大关系,人工智能技术的发展为肝病的早期诊断带来了新的机遇,为患者提供了更大的治愈空间。近年来,越来越多的研究验证了深度学习框架下的多模态超声在辅助医生诊断过程中的价值,但是研究多集中在乳腺和甲状腺病变上,肝脏病变的研究还较少。且相比单模态超声诊断模型,多模态模型的特征融合和优化方式也影响着分类性能,同时,多数研究通常平等地对待各模态,忽略了不同模态对疾病诊断贡献不同
学位