复杂背景下声纹特征提取与识别

来源 :中南林业科技大学 | 被引量 : 0次 | 上传用户:yl9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网以及信息化的迅速发展,声纹识别技术在金融、证券、社保、电子商务、银行等远程客户服务的身份确认和公安、军队安全部门的特定人身份自动检测和认证中具有广泛的应用价值和前景需求,是当今世界声音信号处理和生物特征信息检测与识别领域的重要探索方向。近几十年来,在这一领域的研究已经取得了重大进展,但因为说话人个性特征易受外界因素影响以及具体实际环境的复杂多变性,其瓶颈效应也逐渐凸显,因此,在复杂背景下研究有效的语音信息检测方法和更具鲁棒性的特征提取算法对于提高系统的识别率具有非常重要的意义。复杂背景下的声纹识别技术是在高度复杂噪声情况下,通过检测出声音并进一步进行特征提取后,经过分析处理建立识别模型,最后应用识别模型对说话人进行识别。论文主要研究语音端点检测方法和特征提取方法来提高识别效率,主要工作如下。首先,在声音预处理阶段,提出了嘈杂环境下的两种语音信号端点检测方法,根据不同背景复杂程度的信噪比高低分别采用基于谱熵的端点检测算法和基于短时能量和过零率的双门限端点检测算法,实验表明,背景为高信噪比情况下基于短时能量和过零率的双门限端点检测算法效果较好,背景为低信噪比情况下基于谱熵的端点检测算法较优。其次,在特征提取阶段,利用倒谱法计算出基音周期参数,再通过Mel滤波器组将语音信号功率谱转换成Mel倒谱系数(MFCC),然后利用改进特征提取算法将两种参数组成一种声纹特征参量,同时分别对它们进行了实验仿真。最后,在声纹识别阶段,首先提出带噪特征的识别算法(SEMG)算法,即在复杂背景下对语音信号利用基于谱熵的端点检测算法检测端点后,再利用改进特征提取算法特征提取,最后为每个说话人建立一个高斯混合模型(GMM),并通过实验验证了SEMG算法的有效性,达到了理想结果。
其他文献
本文以智讯通讯公司的MIIS(Multi-Information Integration System)信息系统集成项目为研究背景,采用Web Service的系统集成技术,解决当前公司多个信息系统协同应用能力不足的
当前,机动车数量的急剧增加给交通管理带来了许多的问题。为了解决这些交通运输管理的难题,智能交通系统应运而生,成为目前国际道路交通和运输科技研究发展的热点之一。智能交通
目前电能质量业界缺乏统一的数据格式和规范,数据格式千差万别、互不兼容,这非常不利于信息共享和应用集成。另一方面,传统的电能质量系统更倾向于直接操作本地数据库或监测设备来访问数据,耦合性很高,不够灵活,更不易于扩展。因此,如何统一基础数据管理平台、设计合理的数据格式、实现跨地域获取数据成为亟待解决的问题。在电力行业中,对于数据质量的要求越来越高。可是从当前的实际情况来看,电能质量系统采集的数据一旦出
手写体数字识别是光学字符识别技术(OCR)的一个分支,在文件资料自动录入、金融税务系统数据统计、图像文本的压缩储存、自动阅读器、盲人助读器等领域有着广阔的应用前景.本
临床实践指南(CPG)是一种依据医学文献库中摘录的医疗证据和领域中专家的共识创建的文档,旨在提高医护质量和减少不必要的开支。基于CPG的医疗辅助决策系统是一种推广临床实践
近年来,伴随着多媒体技术和计算机网络技术的飞速发展,全世界数字图像的容量正以惊人的速度增长,无论是军用还是民用设备,每天都会产生容量相当于数千兆字节的图像。而在这些数字
起源于信息隐藏技术的数字水印技术,为实现有效的知识产权保护提供了一条崭新的思路,近年来已成为多媒体信息安全研究领域的一个热点问题。纺织织物是日常必需的消费品,其品牌商
安全协议也称密码协议,是建立在密码体制基础上的高互通的消息交换协议,它运行在计算机通信网或分布式系统中,其目的是在网络环境中提供各种安全服务。安全协议是构建安全网络环
基于Topic的Blog的隐含社区发现为Blog的应用研究开辟了一个很有前途同时也具有相当挑战性的方向。随着Internet在人们生活中的广泛应用,Blog作为一种新型的网络媒介交流工具
高可信软件技术是软件理论研究和工程实践领域关注的焦点之一。近年来,越来越多的形式化方法被应用于提高软件质量的研究上。软件测试是保证软件产品可靠性和正确性的有效手段