说话人识别系统的信道顽健性研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：a6532460

【摘要】

：

本文主要从信道补偿和信道顽健(Robust)特征两个方面,研究如何提高说话人识别系统的信道顽健性.在信道补偿方面,将两种语音识别中的信道补偿方法,最大后验概率MAP(Maximum A

【作者】

：

高荣春

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2005年期

【关键词】

：

说话人辨认信道顽健性信道补偿说话人识别语音识别人工神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文主要从信道补偿和信道顽健(Robust)特征两个方面,研究如何提高说话人识别系统的信道顽健性.在信道补偿方面,将两种语音识别中的信道补偿方法,最大后验概率MAP(Maximum A Posterior Probability)方法和极大似然估计ML(Maximum Likelihood)方法,应用到说话人识别系统当中,并且将之与倒谱平均减CMS(Cepstral Mean Subtraction)方法进行比较.在信道顽健特征方面,引入基频相关特征及其说话人模型,并以之为基础进行二次判决.在应用GMM(Gaussian Mixture Model)进行第一次识别的基础上,根据GMM得分判断是否需要进行二次判决.如果需要二次判决,则从所有参与第一次识别的说话人中,筛选出少量几个说话人参与二次判决.对每一个筛选出来的说话人,从其对应的基频相关说话人模型上得到3个基频相关结果,使用人工神经网络将这3个结果与已有的GMM得分有效融合,得到融合后的结果.二次判决是在这些融合后的结果上进行的.所采用的基线系统为文本无关的说话人辨认系统.实验结果表明,首先应用MAP方法进行信道补偿,再利用基频相关特征及其说话人模型进行二次判决,这样得到的闭集测试的最好识别率为92.5﹪.此外,训练说话人模板时,应该使用语音段参与训练而不是整个训练文件,也就是在训练之前去掉训练文件中的静音段,本文提出了一种利用动态能量阈值以及平滑后处理来去掉静音段的方法.

其他文献

基于信息技术的PKM研究

计算能力的飞速发展与知识的爆炸性增长是当前的两大趋势。个人在这样的环境下加强知识管理是一个必然的选择。个人知识管理成为一个新兴的研究领域，取得了一些成果。首先，这些

学位

知识管理关系数据库面向对象理性智能系统高校教学

手语数据的分析和处理在手语识别和手语生成上的研究

本文进行了如下的研究工作:1.提出了一种基于多分辨率思想的多层分类器的手语识别方法.该方法对来自数据手套的手语输入,首先阐述了主成份分析方法、独立成份分析方法、最大

学位

手语识别多分辨率识别数据分析数据生成手语数据

基于TMS320DSC25的嵌入式网络视频服务器系统设计

　　本文采用嵌入式设计方案和MPEG-4软件压缩技术，设计了一个基于TCP/IP的嵌入式网络视频服务器系统，该系统分为数据采集、控制服务、压缩处理和网络传输几部分。以TI的TMS320

学位

网络视频嵌入式系统软件压缩通信协议

高龄化社会人本信息技术研究-家庭智能监护系统

本研究的目的是希望利用信息技术来实现针对空巢家庭老人的连续性、无监督的家庭日常生活的智能监护，这样的方法一方面可以降低子女和社会的压力，另一方面也可以消除老人对

学位

高龄化社会空巢家庭老人家庭智能监护

实时数据处理事务调度与控制研究

本文对实时事务的调度进行了研究，提出了双截止期双优先级的优先级分派方法和基于该优先级分派方法的定时调度策略；这些方法和策略在现有技术的基础上，深入考虑实时事务的需求

学位

实时数据库实时事务事务模型

高效网络入侵检测系统的研究

本文通过对入侵检测的历史、分类以及目前的研究现状进行详细的分析,总结了目前入侵检测领域的成就及不足,提出了在大流量网络环境下的入侵检测应当解决的问题.在总结归纳的

学位

入侵检测规则学习信息融合TSDM异常检测算法

虚拟管理框架研究及其在VSDS中的实现

随着信息技术的发展,资源系统的规模和数量不断扩大,系统的管理和集成日趋复杂,如何设计合理的资源管理基础架构成为亟待解决的基本问题。本文旨在研究一种新型的管理框架来

学位

存储系统虚拟管理框架资源管理体系结构虚拟用户系统统一管理

汉语文语转换中韵律标注的研究

本文的几个研究方面包括语音库的建设、文本标准化、拼音标注、停顿指数标注、重音判别。都是围绕着将文本向语音的中间过渡阶段的转化这个主题以及为转化提供相应的资源

学位

汉语文语转换韵律标注停顿指数标注重音判别语音库文本标准化

CORBA技术在CDMA网络综合管理系统中的应用

CORBA Common Object Request Broker Architecture通用对象请求代理结构)是一个分布式的面向对象应用架构规范。CORBA真正地实现了跨平台性。CDMA(Code Division Multiple A

学位

CORBA中间件CDMA系统网络接口综合网络管理系统

中文搜索引擎的设计与实现

搜索引擎是Web信息检索的主要工具,Crawler是搜索引擎的核心组件,用于搜集Web页面。实现一个可扩展、高性能、大规模的中文搜索引擎,核心是设计一个可扩展、高性能、大规模的

学位

搜索引擎神经网络网络爬虫中文分词

说话人识别系统的信道顽健性研究

其他学术论文