【摘 要】
:
语音是人的自然属性之一,由于发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩,那么我们就可以通过分析语音信号来识别说话人,由此使得我们研究
论文部分内容阅读
语音是人的自然属性之一,由于发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩,那么我们就可以通过分析语音信号来识别说话人,由此使得我们研究说话人识别具有现实意义。随着计算机技术和通信技术的高速发展,说话人识别技术被广泛的应用于各个领域,如在公安司法领域、军事领域中进行监听与鉴别,在安全保卫领域中出入控制,财经领域中转账和出纳,信息服务领域中自动信息检索和电子商务等。 论文主要对说话人识别的一些技术进行了较为系统和全面的研究,重点对基于矢量量化(Vector Quantization,VQ)和隐马尔可夫模型(Hidden Markov Models,HMM)两种方法的说话人识别研究,所做的主要工作包括以下几个方面: 1.介绍了一种新端点检测算法。传统的端点检测是采用短时能量和短时平均过零率的双门限端点检测方法。论文利用一个新的判决门限:能频值。能频值定义为短时能量和过零率的乘积,利用能频值既顾及了声母的高过零率又顾及了韵母的高能量,从而提高了语音信号与背景噪声的分辨力,适应环境的能力强。 2.研究并实现了一种改进谱减法的语音去噪新方法。实验表明该方法提高了输出信噪比,改善了语音质量,具有良好的语音去噪效果。同时,详细研究了两种最常用的语音特征参数:线性预测倒谱系数(Linear Prediction Cepstrum Coefficient,LPCC)、Mel倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)及其差分。 3.介绍了矢量量化技术,矢量量化的基本原理,LBG算法等,搭建了一个实时说话人识别系统,并采用此方法比较特征参数在说话人识别中的优劣性。 4.隐马尔科夫模型在说话人识别中的应用,隐马尔科夫与矢量量化两种方法相结合来进行说话人识别实验,并与不同方法,不同特征参数组合相比较,验证了该方法的识别优越性。利用改进GMM模型中EM算法进行说话人识别实验,验证改进后的有效性。
其他文献
随着传感器技术和信息网络化的发展,无线传感器网络在工业、农业、军事、环境、医疗等领域具有巨大的运用价值。确定事件发生的位置或采集数据的节点位置是无线传感器网络最
当今医学超声成像技术的发展趋势主要表现为数字化、多功能化和多维化。其中,超声三维或四维成像技术与常规二维超声成像相比,不仅可以实现更加直观形象的立体显示,而且可以
人脸检测是人脸识别的前期重要工作,近年来已经成为计算机视觉和模式识别领域的研究热点之一。当前人脸检测的应用背景早已超出了人脸识别系统的范畴,随着计算机应用的普及、
人脸是视觉世界最常见的对象,广泛存在于可视电话、视频消息、电视新闻与电视会议等视频业务中。随着人机交互方式的演变、生物认证、物体检测技术的发展以及商业安全领域对
图像分割是图像处理技术中的一个核心领域,由于图像分割的质量往往直接决定了后续图像分析、理解等任务的成败,因此图像分割技术的研究具有重要的意义。超像素(Superpixel)分
随着近年来Internet的普及和宽带应用的发展,光纤到户(Fiber To The Home,FTTH)作为接入网发展的最终目标,被广泛认为是一种理想的综合接入方案。无源光网络(Passive Optical
RS(Reed-Solomon)码是一种多进制的BCH码。由于其特有的结构特点,既适宜纠正随机错误,更适宜纠正突发错误,因而被广泛地用于各种通信系统及数据存储中,如深空通信、移动通信
水声目标识别是水声领域的难题之一。一般的水声目标识别方法往往利用单一声纳的信息进行,由于水声目标局部特征稳定性低和海洋环境的复杂性,这种方法的性能和可靠性较差。随着
目前网络技术日新月异,网络的复杂性在不断增长,对网络管理的要求也日益增加。传统系统的诸多问题,如安装配置、备份恢复、资源共享、系统安全和性能优化等等,都是当今网络管
现代设备技术水平不断提高,生产力自动化要求越来越高,相应地故障随之增加。变压器作为电力系统中非常复杂而且非常重要的设备,其工作状态对电力系统、企事业单位生产及居民生活具有十分重要的影响。配电自动化是电力系统自动化工程中重要的一个方面,正在在受到人们的普遍关注和重视。近年来国内配电网事业发展迅速,提高供电质量和供电可靠性,实施高效准确的抄收系统已是当务之急。低压配电网络面向广大的低压电力用户,具有数