改进的核函数算法及其在说话人辨认中的应用研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:liuliumin3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别以其独特的方便性、经济性和准确性的特点,在生物特征识别领域具有广阔的应用前景。但由于现有的说话人识别算法面临训练量大、实时性差以及受信道干扰严重等问题,使得说话人识别技术在实际应用方面受到了限制。在统计学习理论基础上发展起来的支持向量机,因其优良的泛化性能得以在说话人识别领域受到广泛的关注。但由于支持向量机尚处于发展阶段,很多方面尚不完善,因此研究并完善说话人识别技术的理论和实现算法具有重要意义。本文围绕着如何提高说话人辨认系统的识别率和鲁棒性的问题进行了研究,重点在基于超向量的核函数的生成方法上进行了探索,主要做了以下的工作:(1)对特征参数提取的改进。首先,将高斯混合模型-通用背景模型(GMM-UBM)引入到说话人辨认中来,利用说话人无关的特征分布来近似说话人训练语音未覆盖到的发音情况,弥补了说话人训练语音不足的缺点;然后,采用MAP自适应算法对特征参数均值进行自适应后排列生成超向量。(2)采用新的核函数(KL散度核函数、L~2内积核函数和基于NAP映射的核函数)应用于说话人辨认。这三种核函数都是以超向量为特征参数得到的,超向量的特性使得支持向量机可以在整体语音序列上进行分类,而传统的支持向量机是基于帧一级的处理,是将不等长的语音段切割为彼此独立的的帧来处理的,通过平均各个帧上的决策值来判定语音对应的话者身份。由于不需要在分帧时加入冗余信息,并且降低了运算复杂度,因而提高了支持向量机的分类能力。同时,为了减小交叉信道干扰和噪声等因素对系统识别率的影响,采用基于NAP映射的核函数,将说话人超向量中与说话人特征向量无关的信道子空间的冗余信息去除掉,提高了系统的鲁棒特性。(3)在自建语音库的基础上,用MATLAB进行仿真实验。首先将本文改进后的特征提取方法与改进前的方法进行了比较。随后,将本文采用的三种新型核函数应用于支持向量机。实验结果显示,本文采用的改进的核函数与传统的RBF核函数和多项式核函数相比较,它们的识别率都相对提高了12%以上。通过系统鲁棒性能实验可以看出,使用基于NAP映射的核函数的系统的鲁棒性得到了很大的提高。
其他文献
进入二十一世纪以来,我国的航天技术得到了飞速发展,在轨运行的航天器数量越来越多。以陆地测控站和海洋测量船为主体的传统航天测控手段建设成本高昂、轨道覆盖率低,已经不
图像测量技术是将图像处理技术应用于测量领域的一种新测量方法。它将被测对象的图像作为信息的载体,从中提取有用的信息达到测量目的。其具体原理是应用数字图像处理技术提
NAT-PT(Network Address Translation-protocol Translation,网络地址转换-协议转换)是IPv4网络与IPv6网络过渡期间实现两网通信的一个解决方案。作者参与了H3C公司的“NAT-PT
随着现代信号处理技术的持续发展,作为其中的重要组成部分的阵列信号处理技术在该领域的地位也愈加凸显。在此之中,自适应波束形成技术凭借其优良的性能被广泛的应用于雷达、天
目前,采用计算机视觉技术是集装箱自动化装卸作业中实现集装箱识别和定位的发展方向。本文对集装箱的自动化装卸技术进行研究,构建了集装箱装卸模拟系统。利用该模拟系统在实
近几年,随着网络应用的普及,人类通过网络获得的信息越来越丰富,同时对网络的依赖程度也逐步增加。多媒体信息具有直观和信息量大等特点,受到人们的广泛欢迎,这使得网络上的
近年来,频率编码雷达得到了迅速的发展和广泛的应用。论文围绕频率编码雷达目标探测展开,基于Costas频率编码信号和Pushing频率编码信号,提出一种联合目标探测方案,并通过计
低速无线个域网(LR-WPAN,LOW Rate-Wireless Personal Area Network)是在低速率、低功耗、低成本的设备之间建立无线通信、实现各种信息交互的一种区域性联网技术,在智能家居
计算机立体视觉经过几十年的发展,目前已经成为计算机科学的重要研究领域之一。双目立体视觉作为计算机视觉中的一个重要分支,一直是计算机视觉研究的重点和热点。双目立体视觉
远程控制系统指能够在本地计算机上通过远程控制软件发送指令给远程的计算机,从而操纵远程计算机使之能够完成一系列工作的系统。本文在一般的远程控制系统的原理基础上,设计和