基于语音分离的声纹识别技术研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:limanyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今随着信息技术和科技水平的快速发展,国家对信息安全的需求程度也越来越高,而生物特征识别结合了生物学和信息学,使身份识别更加的方便安全。其中,声纹因其获取成本低、处理相对简单等优势,从一开始就是生物识别领域一个重要的研究方向。近几十年来,声纹识别领域已经获得了重大的进步,被广泛应用于国防,金融,刑侦,医疗等军用民用安全领域。但是面对多人说话场景或者强干扰噪音的背景下,声纹识别的效果依旧不理想。针对多人说话背景下声纹识别效率低下的问题,需要对语音进行先分离后识别,以提高识别效率。本论文针对特征提取、语音分离、声纹识别等相关算法模型进行具体描述,就基于语音分离的声纹识别系统展开深入研究。论文先总体描述了语音分离及声纹识别的基础理论,然后对语音分离、融合特征提取、模型训练、模式匹配等内容进行具体分析。在语音分离阶段,选择利用改进高频区域的计算听觉场景分析模型(CASA)进行语音分离,得到目标说话人的语音波形。在特征提取阶段,选择对基于人体发声结构提出的基音周期和基于人体听觉结构提出的Mel频率倒谱参数及其差分参数进行融合得到3L+1维的融合特征参数PITCHMFCC。在声纹识别阶段,分析经典声纹识别模型GMM,提出融合CASA的语音分离识别模型SGMM并从多个维度进行仿真实验,比较两个声纹识别模型在单人和混合语音场景下的识别准确率,此外,还分析了不同性别混合语音,不同背景语音长度以及说话人录制背景语音时和话筒的不同距离对SGMM模型识别率的影响。最后,在仿真环境下实现基于语音分离的声纹识别系统,并对其系统模块和流程进行细致描述和展示。本论文主要工作如下:提出基于基音周期和Mel频率倒谱参数的融合特征参数,分析计算听觉场景分析语音分离模型和GMM声纹识别模型,提出了语音分离识别模型SGMM,并用实验证明了该模型的有效性,最后通过编程仿真实现了基于语音分离的声纹识别系统。
其他文献
<正>鼻旁窦CT检查已成为耳鼻喉科的常规检查项目,但由于扫描对象包含对射线敏感的眼球,故降低辐射尤为重要。鼻旁窦主要由骨、空气及软组织组成,具有较好的组织密度对比度,从
在施工企业各项经济管理活动中,工程预结算管理是重要的组成部分。抓好工程预结算管理工作。对促进企业生产经营管理、降低工程成本、提高经济效益具有十分重要的意义。本文从
1995年10月,北京市宣武区政府在广安门外建立了“蓟城纪念柱”,著名历史地理学家、北京大学侯仁之教授亲自撰写的《北京建城记》镌刻在柱前的石碑上。宣南是北京城的起源地,
鲁迅小说中关于“吃”的描写不胜枚举,一方面“吃”作为人的生存本能,是人最基本的尊严,是“五四”发现“人”的第一步;另一方面“吃”这一形而下的行为又往往带给人困扰,甚
本论文从建构主义理论的视角,运用会话分析的理论和方法,首先对汉语多人会话自建的17万字语料库进行分析,认为汉语在话轮、反馈项目、话轮转换规则、话轮控制策略、打断、话