支持向量数据描述的若干问题及应用研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:redmend
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计学习理论的目的是研究有限样本下机器学习的特征,为有限样本学习问题提供了完备统一的理论框架。支持向量机(Support Vector Machine, SVM)就是在此基础上发展起来的新的学习方法,它是基于结构风险最小化原则以及与多种机器学习方法相融合的标准技术,在使用过程中,己展现出许多优于其它方法的性能。支持向量数据描述(Support Vector Data Description, SVDD)是一种源于统计学习理论和SVM的全新的数据描述方法,与SVM寻求最优超平面不同,SVDD的出发点是寻求一个包容所有目标样本数据的最小超球体。这种有监督的单类分类器,被广泛应用于故障检测、工业及医疗检测、网络安全、目标类识别、入侵检测以及人脸识别等领域,近年来其研究在机器学习领域中非常活跃。然而,由于支持向量数据描述是机器学习领域中比较新的理论,因此在很多方面尚不成熟,亟需做进一步研究。其中,关于SVDD的学习方法的研究是该理论的重点和难点之一。通常被使用的支持向量数据描述方法是有监督的机器学习方法。本文以提高学习能力为目标,分别从无监督和半监督两方面,围绕新型学习算法探索、提高学习准确率、数据预处理及扩展应用等方面对支持向量数据描述的若干问题进行了研究,主要工作结果如下:(1)针对无监督模式下传统的SVDD方法无法准确描绘目标数据的分布问题,提出了基于人工免疫核聚类的支持向量数据描述方法AIKCSVDD(Artifical Immune Kernel Cluster-based SVDD)。AIKCSVDD将人工免疫核聚类产生的记忆抗体作为目标数据点,使用SVDD方法进行学习。在AIKCSVDD中,一方面实现了核聚类方法解决各类数据边界不清晰的长处、免疫网络聚类方法全局收敛以及不需要先验知识等优点的有机结合;另一方面,由于用记忆抗体代替原始数据进行学习,从而在不事先指定分类个数的情况下仍能更好展现原始数据的全局分布特征。(2)针对半监督模式下传统的SVDD方法无法准确描绘目标数据的分布问题,提出了基于半监督学习的加权支持向量域数据描述方法。在现实生活中,大量的具有已知分类信息的数据通常很难得到,为了能在较少已知信息的情况下准确描述未知数据集,考虑将标记繁殖及加权思想应用到SVDD方法中。为此,本文首先利用半监督的标记繁殖算法,根据已知信息有效学习大量未标记数据中的隐含信息,然后再通过加权的SVDD方法学习数据集的潜在分类情况。实验结果表明,该方法在较少已知信息的情况下明显优于传统的SVDD方法。(3)在前述半监督工作的基础上,对半监督学习方法展开深入研究,从经典的的kNN(k-Nearest Neighbor)分类方法入手,给出了一种基于半监督加权距离度量学习的kNN分类方法。为了从有限的已知标签数据中找到一种合适的距离度量,考虑使用相关成分分析(Relevant Component Analysis, RCA)方法来学习一个马氏距离度量。然而传统的RCA方法在度量学习过程中对类别信息标记的数量具有很强的依赖性,且在标记信息数量很少或有错误的情况下可能会引起相应的度量偏差,进而考虑使用半监督的学习方法来克服传统RCA方法的局限性。该方法可从极少量已知标记信息中通过标记繁殖和加权算法学习到一个马氏距离;进而将其应用于kNN分类方法。实验结果表明,在标记信息极少的情况下该方法的分类效果优于采用欧式距离的kNN分类方法。(4)针对在故障诊断等应用领域数据维度较高、数据分布不均匀等特点,本文研究并给出了基于核距离度量LLE的支持向量数据描述方法。为了能够挖掘出隐藏在高维观测数据中有意义的低维结果,更好地提取易于识别的特征,该方法考虑在应用数据的预处理过程中使用LLE方法对数据降维。但由于LLE算法需要稠密采样,在高维稀疏空间中采用欧式距离往往导致效果不尽人意的状况,因此使用核空间距离代替原LLE算法的欧式距离度量,然后利用改进的LLE方法对数据集进行降维,从而使新得到的数据在较小的数据维度中更好地保持了原有的数据流形。最后应用SVDD方法处理新得到的数据。基于SVDD的故障检测实验表明,该方法特别适合于维度较高、分布不均匀的应用数据集。综上所述,本文对支持向量数据描述的若干问题及应用开展了研究,文中提出的一些新方法对于提高SVDD的学习能力很有理论意义和应用价值。在后继工作中,将进一步完善、深入现有的研究结果,同时将研究成果融入到工程应用实践当中。
其他文献
转专业女大学生是女大学生中的一部分特殊人群。本文以南京林业大学经管院转专业女大学生为例,通过问卷调查、访谈等方法,发现她们身上所存在的强迫、抑郁、焦虑、人际关系敏
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
动态原子力显微镜微悬臂为无限自由度系统,具有多个谐振模态的振动特性。微悬臂的工作振动频率是影响动态原子力显微镜系统的测量特性的关键参数之一,为了提高微悬臂的谐振频
本次课题的核心内容和研究思路可概括如下:分析舰艇自噪声的非平稳特征,针对ANC系统的弊端探讨解决方案;设计并完善以人工神经网络为框架的自适应噪声抵消系统;引入模糊逻辑推理
[摘 要:高等教育阶段是我国教育事业当中,最为重要的组成部分。將创新创业教育内容,全面地融入到高校教学体系中,有利于推动学生全面发展。本文首先对高等院校在校生学生们的创新创业教育状况,进行了论述和分析,提出了教学管理理念相对落后,体系不够完善以及师资力量薄弱等方面的问题;其次,提出了高等院校将创新创业教育,融入到课程体系中的策略,希望能为该领域关注者提供有益参考。  关键词:创新创业;高等院校;课
<正>还记得刚参加工作时,我怀着满腔的热情全身心地投入到工作中。可在工作中,作为一名刚刚踏上工作岗位不久的体育教师的我,慢慢发现体育课虽然是学生喜欢上的一门学科,身体
提出了一种高温超导带材的故障电流冲击模型的建立方法,该方法以超导带材的数学模型为基础,用可变电阻模拟带材的阻值变化情况;搭建了带材的电路模型,编写了电阻值的计算程序
在64例有男性素型脱发男性及40名无脱发而年龄相同的男性中,测定其血浆内“结合球蛋白性激素”(sex hormone binding globuline,SHBG)血浆内睾丸酮及唾液内睾丸酮的水平。脱
电液伺服控制系统以其功率—重量比大,系统响应快,负载刚性大,控制精度高的特点,广泛应用于冶金,矿山,船舶,工程机械,航空航天等工业控制领域。电液伺服阀作为电液伺服控制系