基于混合倒谱MFCC和GFCC的声纹识别方法的研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:hnbc2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声纹识别是人工智能AI和身份安全认证的主要技术之一,围绕“智能时代,数字经济”的主题下,实现计算机与人之间的智能交流,声纹识别将是必不可少的科学技术关隘。  本文的具体工作如下:以声纹识别的整体结构为路线,先是分析目前声纹识别的技术和基本概念,再逐一讲解声纹识别的三大部分——前期处理、特征参数和模式识别。  本文的主要内容和创新点如下:  (1)传统双门限法和音量阈值法由于只使用固定的阈值来检测语音段,不能随着环境变化而修正阈值参数,抗噪性能差,本文提出一种凹点分析端点检测的方法,配合基因周期过滤大音量噪声,实现语音段的精确检测。实验表明,即使信噪比逐渐上升,改进的算法也优于传统双门限法和音量阈值法的抗噪性能,并且低信噪比时仍能有效检测语音端点。  (2) MEL倒谱系数(MFCC)作为特征参数有很多优点,而MFCC的滤波器个数和阶数都是按传统的24滤波器12维来运算,为了提高识别的效率和准确率,本文提出用增减分量分别检验MFCC每个倒谱系数ci的贡献度,改进滤波器个数和倒谱系数维数,通过新的倒谱系数的组合来改进MFCC的性能。  (3)传统的单一的MFCC参数抗噪性能比较差,不足以抵抗复杂环境下的噪声,本文提出一种全新的混合倒谱特征参数,添加具有很强抗噪性能的Gammatone滤波器的倒谱特征参数(GFCC),配合体现帧与帧之间动态特性的差分MFCC和差分GFCC,得到(MFCC+△MFCC+GFCC+△GFCC)的混合倒谱特征参数,经过实验表明,新的混合倒谱特征参数具有更高的抗噪性能和识别率,在正常实验室环境下识别率能到达到94%以上。
其他文献
随着机器人技术的快速发展,服务机器人已慢慢融入了我们的日常生活,其在助老助残、医疗康复、公共安全等领域扮演着越来越重要的角色。而服务机器人通常工作于家庭或办公室等室
本论文所涉及的科研项目来源于某天然气门站监控系统设计。监控系统的主要功能是对门站天然气的温度、压力、流量和阀门的监控,论文主要阐述了天然气监控系统开发过程中所用到
工业机器人作为先进、智能工业化设备的代表,在社会生产中有着很重要的地位,其应用领域也在不断的扩大。建立合理的机器人模型是工业机器人控制的基础,龙门机器人是工业机器
机器视觉作为计算机技术其中的一部分,随着计算机技术的不断发展而逐步成熟。现今自动化产业从“工业3.0”阶段发展为以智能制造为核心的“工业4.0”阶段,机器视觉作为现今自
在AOD法(Argon Oxygen Decarburization)冶炼低碳铬铁的过程中,产品中的碳含量、磷含量及硫含量是衡量产品质量的重要因素。然而冶炼过程是一个非常复杂的多元多相高温状态下
随着人类社会科技文明的高度发展,生活节奏的不断加快,汽车作为代步工具的时代逐步到来。为了满足乘坐舒适、操纵方便、安全可靠和人类不断追求完美的要求,汽车产品己由初期
学位
随着科学技术的发展,对水文信息不断提出新的要求,水文观测的项目内容也在增加。其中水库的供水、灌溉、防洪、发电等与人民生活息息相关,为此,设计出一套具有先进智能检测设备的
车轮擦伤情况对于列车的安全运行非常重要,本文给出了一种基于PSD(Position Sensitive Detector)位置敏感探测器的列车车轮擦伤在线检测方法,该方法可以实现对车轮擦伤的在线检测
机器人是一种由各种电机驱动的装置,驱动电机的工作性能影响着机器人的工作性能。然而,传统研究中很多机器人控制方法的研究只对机器人动力学进行研究,没有考虑电机的因素。