论文部分内容阅读
支持向量机(Support Vector Machine, SVM)是由Vapnik领导的AT&TBell实验室研究小组于1995年提出并发展起来的一种机器学习模型。SVM是在神经网络模型后机器学习领域的又一个极具代表性的数学模型,在解决高维、小样本及非线性模式识别问题上具有特有的优势,目前已经应用于多个机器学习和模式识别领域。作为一个新兴的数学模型,SVM极具发展潜力。其中核函数的选择和构造方法研究是支持向量机的研究热点和重点。核函数的基本作用是将两个低维空间的输入向量经过变换计算出在高维空间中的内积值,其结果是原来位于低维空间中的两组线性不可分的样本映射到高维空间中后就可能变得线性可分。因此核函数的选择对于支持向量机的分类性能起着决定性的作用。但是,到目前为止对于如何选择和构造核函数却还没有一个指导性的理论。本文通过对支持向量机及核函数理论分析,提出核函数泛化能力评估模型、动态宽度尺度径向基核函数模型、基于径向基核的多核模型和基于相似度的核矩阵模型,对于每个模型进行仿真分析最后利用森林火灾视频识别来比较各个模型的优缺点及适用场合。主要工作包括:1、核函数评估模型及评估方法研究通过对常用评估方法模型的探讨,提出一种改进的评估模型以及基于AUC评估准则的优化AUC准则,并利用实验统计的方法对常用模型准则和改进模型准则进行比较分析,同时给出常用核函数的性能评估。2、径向基核函数动态核宽度和动态核尺度研究根据具体分类问题,对径向基核函数的宽度进行动态调整,从而防止数据密度较大的区域存在的过学习现象和数据密度较小的区域存在的欠学习现象。同时,对于数据密度较大的区域采用小尺度的度量单位而在数据密度比较小的区域采用大尺度的度量单位但是保持数据关系的不变,从而得到更加精确的数据度量的描述,使分类的精度得到提高。最后根据上述两点设计基于动态核宽度和动态核尺度的改进径向基核函数。3、基于改进径向基核函数的多核函数研究引入金字塔概念,利用多个传统径向基核函数和动态宽度尺度核函数来构造多核函数,根据金字塔不同层的样本密度,分别选择不同参数或类型的核函数,在保留径向基核函数优点的前提下解决单一核函数引入的近似与假设带来的缺陷,同时减小局部泛化的风险。4、基于相似度的核矩阵构造方法研究根据核函数定义及原始样本数据构造基础核矩阵,再利用散乱数据插值的办法确定特征空间中感兴趣点的内积值,从而构造出满足Mercer条件的扩展核矩阵。主要涉及核矩阵的判定、基础核矩阵和扩展核矩阵的不同构造方法的优缺点的探讨。5、核函数研究在森林火灾视频识别中的应用提出了适合于森林火灾视频识别的特征选择方法,对改进径向基核函数、多核函数和核矩阵进行实际验证性研究,比较其分类性能、泛化性能和分类效率。