【摘 要】
:
本文主要从信道补偿和信道顽健(Robust)特征两个方面,研究如何提高说话人识别系统的信道顽健性.在信道补偿方面,将两种语音识别中的信道补偿方法,最大后验概率MAP(Maximum A
论文部分内容阅读
本文主要从信道补偿和信道顽健(Robust)特征两个方面,研究如何提高说话人识别系统的信道顽健性.在信道补偿方面,将两种语音识别中的信道补偿方法,最大后验概率MAP(Maximum A Posterior Probability)方法和极大似然估计ML(Maximum Likelihood)方法,应用到说话人识别系统当中,并且将之与倒谱平均减CMS(Cepstral Mean Subtraction)方法进行比较.在信道顽健特征方面,引入基频相关特征及其说话人模型,并以之为基础进行二次判决.在应用GMM(Gaussian Mixture Model)进行第一次识别的基础上,根据GMM得分判断是否需要进行二次判决.如果需要二次判决,则从所有参与第一次识别的说话人中,筛选出少量几个说话人参与二次判决.对每一个筛选出来的说话人,从其对应的基频相关说话人模型上得到3个基频相关结果,使用人工神经网络将这3个结果与已有的GMM得分有效融合,得到融合后的结果.二次判决是在这些融合后的结果上进行的.所采用的基线系统为文本无关的说话人辨认系统.实验结果表明,首先应用MAP方法进行信道补偿,再利用基频相关特征及其说话人模型进行二次判决,这样得到的闭集测试的最好识别率为92.5﹪.此外,训练说话人模板时,应该使用语音段参与训练而不是整个训练文件,也就是在训练之前去掉训练文件中的静音段,本文提出了一种利用动态能量阈值以及平滑后处理来去掉静音段的方法.
其他文献
计算能力的飞速发展与知识的爆炸性增长是当前的两大趋势。个人在这样的环境下加强知识管理是一个必然的选择。个人知识管理成为一个新兴的研究领域,取得了一些成果。首先,这些
本文进行了如下的研究工作:1.提出了一种基于多分辨率思想的多层分类器的手语识别方法.该方法对来自数据手套的手语输入,首先阐述了主成份分析方法、独立成份分析方法、最大
本文采用嵌入式设计方案和MPEG-4软件压缩技术,设计了一个基于TCP/IP的嵌入式网络视频服务器系统,该系统分为数据采集、控制服务、压缩处理和网络传输几部分。以TI的TMS320
本研究的目的是希望利用信息技术来实现针对空巢家庭老人的连续性、无监督的家庭日常生活的智能监护,这样的方法一方面可以降低子女和社会的压力,另一方面也可以消除老人对
本文对实时事务的调度进行了研究,提出了双截止期双优先级的优先级分派方法和基于该优先级分派方法的定时调度策略;这些方法和策略在现有技术的基础上,深入考虑实时事务的需求
本文通过对入侵检测的历史、分类以及目前的研究现状进行详细的分析,总结了目前入侵检测领域的成就及不足,提出了在大流量网络环境下的入侵检测应当解决的问题.在总结归纳的
随着信息技术的发展,资源系统的规模和数量不断扩大,系统的管理和集成日趋复杂,如何设计合理的资源管理基础架构成为亟待解决的基本问题。本文旨在研究一种新型的管理框架来
本文的几个研究方面包括语音库的建设、文本标准化、拼音标注、停顿指数标注、重音判别。都是围绕着将文本向语音的中间过渡阶段的转化这个主题以及为转化提供相应的资源
CORBA Common Object Request Broker Architecture通用对象请求代理结构)是一个分布式的面向对象应用架构规范。CORBA真正地实现了跨平台性。CDMA(Code Division Multiple A
搜索引擎是Web信息检索的主要工具,Crawler是搜索引擎的核心组件,用于搜集Web页面。实现一个可扩展、高性能、大规模的中文搜索引擎,核心是设计一个可扩展、高性能、大规模的