【摘 要】
:
说话人识别是指通过说话人语音信号的分析和特征提取,从而确定说话人是否在所记录的说话人集合中,进而确定说话人是谁的过程。它在许多领域内有良好的应用前景。 目前在说话
论文部分内容阅读
说话人识别是指通过说话人语音信号的分析和特征提取,从而确定说话人是否在所记录的说话人集合中,进而确定说话人是谁的过程。它在许多领域内有良好的应用前景。
目前在说话人识别中,要提高识别率有两个重要的问题需要解决:一是如何选取能够有效表征说话人特征的可靠参数;二是如何选取合适的识别算法。本文主要是对特征参数的选取进行了初步的探讨,做了如下几方面工作:
1.在特征提取方面,本文中分析了当前最常用的两种倒谱特征参数:美尔频率倒谱系数(MFCC)和线性预测倒谱系数(LPCC)。并对其进行了改进,一方面是采用二次提取的方法,将MFCC和UCC与其各自对应的一阶差分组合在一起形成新的特征参数。另一方面是本文还提出了将美尔频率倒谱系数(MFCC)和线性预测倒谱系数(IJPCC)两个基于不同模型的特征参数组合在一起形成新的特征参数,实验的结果证明了这两种方法与传统的使用单一特征参数进行识别相比都能有效的提高实验系统的识别率。此外,还尝试着在预处理部分加入基于时域特征的端点检测,使用到了短时能量参数和短时过零率相组合,然后在特征提取部分,提取20阶MFCC作为特征参数来进行识别,但实验的结果没有达到理想效果。
2.在识别算法方面,本文对矢量量化的方法进行了研究,并用matlab语言实现了一个有效的说话人辨认识别系统。
其他文献
在软件动态测试过程中,通过执行测试用例并分析其返回信息,可以找到更多的错误和缺陷。不仅如此,通过存储这些执行覆盖信息,特别是在程序正确执行时所覆盖的信息,可以帮助我
超大规模机器学习问题往往是许多机器学习算法在实际应用中的一大限制。这种大规模问题经常会遇到,比如专利分类。即便是像支持向量机这样高效率的学习算法,面对超大规模的数据,照样会难以克服。在这种情况下,突破单机限制,利用丰富的并行计算资源,解决这些大规模学习问题往往是比较可行的办法。最小最大模块化支持向量机(M3-SVM)是基于“分而治之”的思想解决大规模问题的有效学习算法。它通过分解大规模问题,变成大
随着信息技术和Web应用的快速发展,Web服务组合技术逐渐成为企业信息集成的主流技术。从面向过程的角度看,服务组合就是根据业务需求来设计业务流程,为业务流程选择一系列符
低密度校验码是一种能逼近Shannon容量限的渐进好码,其译码采用了仅具有线性时间复杂度的置信传播迭代译码算法,并且可以检测几乎所有错误。由于低密度校验码具有诸多优点,它
电力网络是当代社会发展必需的最基础设施之一,建立可靠稳定的电网控制系统,保证电网的安全经济运行,是十分重要的问题。随着区域电网的互联与发展,国内电网采用分级管理、分层控制和区域独立处理的体制,使得各区域调度中心的数据资源广域分布在各个行政区域,对电力系统一体化仿真计算造成很大困难。由于电力经济市场的发展,在这种分层分区的管理模式下,不可能直接获取各个电力公司相对保密的电网数据,这就进一步加大了一体
增强现实技术是将计算机生成的虚拟物体、场景或系统提示信息叠加到真实世界场景中,增强用户对现实世界的感知。增强现实技术的关键技术有跟踪注册技术、光照技术、显示技术等
Internet的快速发展,使得流量一直处于爆炸性的增长之中。加上通信技术的进步,网络设备正承受着越来越多的流量压力。最近的研究表明,目前的网络设备的处理速度能力在10Gb/s
嵌入式系统有限的资源(如处理能力、存储空间等)及特殊的运行环境使其安全性设计和实现不同于其他通用计算机系统。在有限的资源下,系统不仅要完成预期的功能,还要支持加密算
随着电力工业的蓬勃发展,用电设备的快速增加以及大量非线性电力设备的使用,给电网带来的谐波污染越来越严重,对电力系统的安全运行造成了极大的影响。针对高精度谐波检测的具体
电脑横机是针织行业中技术含量较高的自动化机械,它融合了计算机数字控制、电子驱动、机械设计、电机驱动、针织工艺及软件工程等技术为一体,可以编织复杂的手摇横机无法完成的