任意文本的说话人识别系统研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户：haojian19831212

【摘要】

：

自动说话人识别是指根据包含在语音中的同说话人有关的信息来自动识别说话人。随着信息技术和通信技术的迅速发展，自动说话人识别技术越来越受到重视。说话人识别可以分为说话

【作者】

：

刘兴立

【机构】

：

大连理工大学

【出处】

：

大连理工大学

【发表日期】

：

2000年期

【关键词】

：

说话人识别说话人辨识说话人模型特征抽取高斯混合模型矢量量化模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自动说话人识别是指根据包含在语音中的同说话人有关的信息来自动识别说话人。随着信息技术和通信技术的迅速发展，自动说话人识别技术越来越受到重视。说话人识别可以分为说话人辨识和说话人确认两大类。本文的研究内容是任意文本的说话人辨识系统，主要做了以下的工作： 1．建立了两个分别包括15个说话人和20个说话人的语音库。录制的语音库考虑了语速快慢、音量、时间间隔等影响说话人辨识系统性能的因素。 2．研究了常见的几种说话人特征的性质和提取方法。这些特征包括基音周期、FFT倒谱、MEL倒谱、LPC倒谱、CMS倒谱、PFCMS倒谱、PFL倒谱和过渡倒谱等。 3．研究了VQ、GVQ、GMM和RBF等四种说话人建模方法和模式分离算法。基于以上特征参数和模型建立了多套完整的说话人识别系统。 4．研究了提高系统的Robust性能的常用方法。包括对特征参数进行后处理、多种特征结合、混合训练、改进判决准则、对语音信号的语速进行处理以及说话人模型的自适应等。 5．最后给出了详细的测试结果。

其他文献

PMIPv6和MIH相结合的网络切换技术研究

伴随着移动通信技术的不断发展，各种无线接入技术的融合使得网络的异构性日益复杂，这也对移动性管理技术提出了更高的要求。切换技术作为移动性管理最重要的功能之一，在异构网络

学位

代理MIPv6MIH网络切换切换时延

智能天线系统仿真研究

该文的主要内容包括:1.综述了移动通信系统的发展状况和第三代移动通信系统中的某些技术.2.建立了接近实际情况的无线通信空时信道模型,考虑了:时延扩展、角度扩展、多谱勒频

学位

码分多址智能天线信道m序列

IP网络实时业务的服务质量(QoS)技术研究

该文首先对QoS(QualityofSvervice)的定义和研究内容进行了阐述.随后根据基于IP网络的实时通信的发展要求网络提供具有不同QoS保证的机制这一问题出发,分析了IETF组织规定的

学位

IntServDiffServGQoSRSVPMPLS

基于DSP的汽车防撞雷达信号的产生与采集

该文介绍了汽车防撞雷达系统的研究现状,给出了一种总体设计方案和系统的数学模型.并对系统的各个部分作了分析和介绍.这几个部分包括:FMCW毫米波雷达优点及其测距原理,A/D转

学位

汽车防撞雷达系统DSP调频信号

TD-SCDMA系统及几个关键技术研究

未来市场对高速数据业务（多媒体业务）,以及全球漫游的迫切要求,又由于第二代移动通信系统所显示的不足,使第三代移动通信系统（IMT-2000）的出现成为必然.同时,第一代系统所拥有的

学位

第三代移动通信TD-SCDMA系统容量智能天线功率控制可变速率系统安全性演进方案

语音波形编码算法研究及实现

该文深入研究了语音波形编码算法及其实现.语音通信的数字化促进了通信技术的进步,通过语音的各种压缩编码算法,可以有效降低语音编码的比特率,提高编码效率.连续斜率可变增

学位

波形编码语音预测增量调制数字信号处理数字滤波器IIR滤波器CVSD编码

数字移动通信中的E-OTD定位研究

论文首先介绍了近年来移动位置业务的发展历程、技术特点和研究方向;分析了基于GSM的E-OTD定位系统的基本原理.并以此为基础,对基于GSM的E-OTD定位系统进行了深入的研究.1、

学位

移动通信移动位置业务时间差定位相关接收无线传输

SHARC系列DSP芯片在水声信号处理中的应用研究

该论文针对水声信号处理的特点,结合两个实际工程项目讨论了DSP芯片ADSP2106X在水声信号处理中的应用,重点讨论了SHARC系列DSP芯片的特点、多DSP芯片并行系统任务的分配、在

学位

SHARCADSP21060目标识别LINK口并行处理水声信号处理

数字专用通信设备中通信子系统的设计与实现

论文致力于数字专用通信设备的研发工作.该设备是采用先进的数字程控交换技术,配备完善的调度功能来实现的.系统具有可靠性高,组网方式灵活,采用开放式结构,具有很强的可扩展

学位

程控交换高级数据链路控制轮叫轮询抗干扰软件模块设计

滑动聚束SAR成像机理与研究

一般情况下，合成孔径雷达工作在条带模式以及聚束模式下。在条带模式下，能够得到关于场景的连续大面积的成像，但由于增加合成孔径长度的困难，分辨率大于真实孔径的一半。聚束模式

学位

合成孔径雷达滑动聚束方位混叠成像机理仿真实验

任意文本的说话人识别系统研究

与本文相关的学术论文