【摘 要】
:
自动说话人识别是指根据包含在语音中的同说话人有关的信息来自动识别说话人。随着信息技术和通信技术的迅速发展,自动说话人识别技术越来越受到重视。说话人识别可以分为说话
论文部分内容阅读
自动说话人识别是指根据包含在语音中的同说话人有关的信息来自动识别说话人。随着信息技术和通信技术的迅速发展,自动说话人识别技术越来越受到重视。说话人识别可以分为说话人辨识和说话人确认两大类。本文的研究内容是任意文本的说话人辨识系统,主要做了以下的工作: 1.建立了两个分别包括15个说话人和20个说话人的语音库。录 制的语音库考虑了语速快慢、音量、时间间隔等影响说话人 辨识系统性能的因素。 2.研究了常见的几种说话人特征的性质和提取方法。这些特征 包括基音周期、FFT倒谱、MEL倒谱、LPC倒谱、CMS倒 谱、PFCMS倒谱、PFL倒谱和过渡倒谱等。 3.研究了VQ、GVQ、GMM和RBF等四种说话人建模方法和模 式分离算法。基于以上特征参数和模型建立了多套完整的说 话人识别系统。 4.研究了提高系统的Robust性能的常用方法。包括对特征参数 进行后处理、多种特征结合、混合训练、改进判决准则、对 语音信号的语速进行处理以及说话人模型的自适应等。 5.最后给出了详细的测试结果。
其他文献
伴随着移动通信技术的不断发展,各种无线接入技术的融合使得网络的异构性日益复杂,这也对移动性管理技术提出了更高的要求。切换技术作为移动性管理最重要的功能之一,在异构网络
该文的主要内容包括:1.综述了移动通信系统的发展状况和第三代移动通信系统中的某些技术.2.建立了接近实际情况的无线通信空时信道模型,考虑了:时延扩展、角度扩展、多谱勒频
该文首先对QoS(QualityofSvervice)的定义和研究内容进行了阐述.随后根据基于IP网络的实时通信的发展要求网络提供具有不同QoS保证的机制这一问题出发,分析了IETF组织规定的
该文介绍了汽车防撞雷达系统的研究现状,给出了一种总体设计方案和系统的数学模型.并对系统的各个部分作了分析和介绍.这几个部分包括:FMCW毫米波雷达优点及其测距原理,A/D转
未来市场对高速数据业务(多媒体业务),以及全球漫游的迫切要求,又由于第二代移动通信系统所显示的不足,使第三代移动通信系统(IMT-2000)的出现成为必然.同时,第一代系统所拥有的
该文深入研究了语音波形编码算法及其实现.语音通信的数字化促进了通信技术的进步,通过语音的各种压缩编码算法,可以有效降低语音编码的比特率,提高编码效率.连续斜率可变增
论文首先介绍了近年来移动位置业务的发展历程、技术特点和研究方向;分析了基于GSM的E-OTD定位系统的基本原理.并以此为基础,对基于GSM的E-OTD定位系统进行了深入的研究.1、
该论文针对水声信号处理的特点,结合两个实际工程项目讨论了DSP芯片ADSP2106X在水声信号处理中的应用,重点讨论了SHARC系列DSP芯片的特点、多DSP芯片并行系统任务的分配、在
论文致力于数字专用通信设备的研发工作.该设备是采用先进的数字程控交换技术,配备完善的调度功能来实现的.系统具有可靠性高,组网方式灵活,采用开放式结构,具有很强的可扩展
一般情况下,合成孔径雷达工作在条带模式以及聚束模式下。在条带模式下,能够得到关于场景的连续大面积的成像,但由于增加合成孔径长度的困难,分辨率大于真实孔径的一半。聚束模式