【摘 要】
:
说话人识别是根据人特有的语音信号来识别出说话人身份的一种生物认证技术,在说话人识别技术中,关键在于两方面:其一,如何从数据量相当大的原始语音信号中提取出反映说话人个
论文部分内容阅读
说话人识别是根据人特有的语音信号来识别出说话人身份的一种生物认证技术,在说话人识别技术中,关键在于两方面:其一,如何从数据量相当大的原始语音信号中提取出反映说话人个性特征的参数。其二,设计出行之有效的分类器。 本文针对说话人识别技术目前存在的技术难点进行了深入的研究,研究内容主要包括两方面: 对于特征参数的提取,目前使用最为流行的特征参数是基于人耳听觉特性的MEL倒谱系数(MFCC),而MFCC是基于语音信号短时平稳的假设,在短时傅立叶变换的基础上提取的。实际上语音信号是一种典型的非平稳信号,短时分析不会随着时间的变化改变分辨率,而小波分析是一种信号的时间—尺度分析方法,它具有多分辨分析的特点,因此本文在基于研究了MFCC的提取原理的基础上,结合小波包对频带的多层次划分,并根据人耳感知频带的特点即Mel频率的分布,选择相应小波包分析后的结点频带,提取出一种基于小波包分析的新型特征参数(WPDC)。 对于分类器的设计,主要应用人工神经网络技术,建立了基于RBF网络的说话人识别系统。针对以上提出的性能下降的问题,本文在分析了已有VQ法与人工神经网络法的基础上,融合两者的优点,提出了一种VQ与人工神经网络相结合的说话人识别系统,该系统能有效的解决随着时间的变化,系统模型失配的问题。
其他文献
在基于定子磁场定向的控制系统中,定子磁通的观测精度对系统的性能影响很大。利用硬件对磁通进行检测不但增加了成本,同时准确性不高。常用的办法是利用电机的电压、电流和转
遥操作机器人是当前机器人研究的一个焦点。互联网出现之前的遥操作机器人发展相对缓慢,实现起来比较复杂。上世纪90年代,互联网技术飞速的发展,给遥操作机器人的发展提供了
超高压直流输电(HVDC)是近年来发展起来的一项新的输电技术,主要应用于远距离大容量输电、电力系统联网、海底电缆或大城市地下电缆送电。若系统发生故障,将使生产停顿以致发生
电机是工业应用及电能生产的基本装备,同时也是自动调节控制系统的核心部件之一,应用领域极为广泛。因此弄清和熟悉电机的特性就更是尤为重要的。本文阐述了一种新的电机特性的测试方法以及具体实施方案。 首先,本文以非接触式的电机转速测量方法为核心,基于计算机技术和仪器技术相结合的虚拟仪器技术开发了一套电机测试系统。根据信号的测量方法设计首先搭建了虚拟仪器测试系统的硬件部分,包括PXI测试平台的选择、传
随着生产技术的发展和生产过程的日益复杂,为确保生产装置安全、高效地运行,需要对与系统的稳定、产品质量密切相关的重要过程变量进行实时监测和优化控制。然而,由于种种原因,这
能源供需系统是一个复杂的非线性系统。能源包括煤炭、石油、天然气、水电、核电等资源,按能否实现可持续利用分为可再生和不可再生两类能源。随着经济的发展,能源的供需问题研
人体运动的视觉分析是一个新兴的研究领域,涉及模式识别,图像处理,计算机视觉,人工智能等多门学科。其目的是要从视频图像序列中检测、跟踪、识别人体并对其行为进行理解与描
浮子流量计是一种传统的变截面流量计,具有结构简单、工作可靠、压力损失小且稳定、可测低流速介质等诸多优点,广泛应用于测量高温、高压及腐蚀性流体介质。但是目前在浮子流
科技发展到今天,语音处理已经与人们的日常生活密不可分。随着语音信号数字化,网络化浪潮的到来,VoIP系统逐渐风靡。VoIP(Voice over IP)是一门快速崛起的语音通信技术。它使