论文部分内容阅读
支持向量机是统计机器学习理论最重要的应用实例之一。它因有着严格的理论支撑和良好的实验性能而在现实的生产生活中得到了广泛的应用。近年来,广泛多样的应用需求为支持向量机提供了更多的研究课题。在此,本文选取多核支持向量机、多类支持向量机、和无监督支持向量机三个方向做了深入的理论研究,并将研究成果应用于音频信号处理领域。本文的主要创新如下:1.提出了快速的结构多核支持向量机。该算法将先进的计算核权重的算法与代表技术发展水准的单核支持向量机相结合,使其具有线性的训练复杂度、与训练样本集规模无关的测试复杂度、和优化不同目标的能力。2.提出了基于多层聚类编码和最优权重译码算法的纠错输出码的迭代编码方法。该方法首先提出了多层聚类编码方法以克服先进的子类纠错输出码中采用决策树构建子类的方法的缺陷,然后提出了最优权重译码算法以保障添加任意的新分类器到纠错输出码分类器组以后,分类器组的风险损失都严格非增。两者的迭代促使纠错输出码的风险损失逐渐下降直至收敛。3.提出了基于稀疏核估计的最大边缘聚类算法。该算法是对先进的切平面最大边缘聚类算法的改进。它首先提出了自适应门限的切平面最大边缘聚类以削弱算法对参数选择的依赖,然后将稀疏核估计算法引入最大边缘聚类,从而将非线性核函数下的时间复杂度从平方降至线性。4.提出了基于支持向量回归的最大边缘聚类算法,并进一步将其拓展到多核聚类、多类聚类。该算法通过引入支持向量回归回避最大边缘聚类问题中的整数矩阵规划问题;通过构造凸包的方法将最大边缘聚类问题松弛为凸优化问题,从而获取其全局最优解;通过提出一系列快速的优化方法在准线性时间复杂度下求解该凸优化问题。它的多核扩展和多类扩展完全继承了其全部优点。5.将上述研究成果应用于音频信号处理的多个问题。在语音端点检测的研究方面,提出了对语音端点检测的一系列改进,并最终提出了一种快速的检测框架、两种基于统计信号处理的新特征和能够支持多特征的基于多核聚类的检测算法;在音乐分类的研究方面,提出了将基于多层聚类编码和最优权重译码算法的纠错输出码用于音乐曲风分类。