语音关键词识别中的置信度研究

来源 :解放军信息工程大学 | 被引量 : 2次 | 上传用户:delicioussmoke
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音关键词识别是从连续的无限制的自然语音流中识别出一组给定的词即关键词的过程,具有广泛的应用前景。关键词识别系统包括关键词检出和置信度确认两大部分,在关键词检出阶段尽可能多的给出关键词候选,提高系统的检出率,然后对候选的关键词进行置信度评估,降低系统的虚警率。置信度的区分能力在关键词识别系统中起着至关重要的作用。本文针对系统在关键词初选阶段虚警率高的特点,研究有效的置信度计算方法,以提高置信度确认的效果,提升关键词识别系统的性能。主要成果如下:(1)提出了一种基于MLP帧级子词后验概率的置信度方法。与主流的HMM模型框架下利用声学模型得分与语言模型得分进行置信度计算不同的是,该方法在MLP模型框架下直接将其输出的每帧语音类别的后验概率用于关键词置信度的计算,克服了HMM建模时假设每帧语音的声学特征相互独立以及对状态建模时采用有限混元高斯分布的不足。关键词检出和置信度确认使用两套不同的模型结构,是两个完全独立的过程,便于融合其它的置信度特征。实验结果表明,新的方法优于HMM框架下主流的置信度计算方法,且与其具有较好的互补性,将两种不同框架下的置信度方法进行简单的线性融合之后,系统的性能得到进一步的提升。(2)提出了一种基于时长和边界信息的置信度算法。主流的基于Lattice后验概率的置信度方法对语音发音变化信息利用不充分,在对时间上相交、词信息相同的弧段进行整合时,没有充分考虑到候选弧段的时长和边界信息,易将前端误识结果引入到置信度计算或忽略处于边界位置的一些弧段,漏掉一些对置信度产生贡献的信息,影响置信度确认的效果。针对这些问题,本文算法通过引入一个松弛因子,用来灵活选择词信息相同且持续时间和起止边界满足条件的弧段进行置信度的计算,综合考虑了候选弧段的时长和边界信息。实验结果表明,新的算法优于主流的Lattice后验概率的置信度方法,具有较好的置信度效果。(3)提出了一种基于得分修正策略的SVM区分性置信度方法。通过置信度得分对候选关键词进行正误判别可以看成是一个标准的二元分类问题,而SVM是一种很好的区分性分类器设计方法,具有较高的分类准确率。实验结果表明,将现有的候选关键词的置信度得分通过SVM转换成区分性置信度,可以进一步提升置信度的区分能力。在进行SVM训练时,针对训练数据中正反样本不平衡的问题,提出了一种得分修正策略,首先通过样本数据近似估计出正误类别的先验概率,然后采用提出的方法对SVM输出的类别后验概率进行修正,将修正后的结果作为候选关键词的置信度。实验结果表明,本文提出的修正策略是有效的。
其他文献
TSGF是一种与恶性肿瘤血管增殖有关的新型肿瘤标志物,已有文献报道它具有广谱性、敏感性及特异性等特点,我院于1999年~2000年动态测定119例恶性肿瘤病人及部分术后接受放化疗
毛泽东在长期革命实践中,自觉地批判继承和发展了中国古代辩证法思想的精华,与马克思主义原理相结合创造性地运用于中国革命和建设之中,对马克思主义的发展做出了前无古人的
随着电厂烟气粉尘、SO2、NOx和Hg等污染物的排放控制限值越来越严格,电厂烟气的净化研究已成为最热门的研究问题之一。汞的剧毒性使得烟气汞的脱除日益引起重视,烟气脱汞技术
电力体制改革后,电价的走势成为各界关注的焦点。本文通过对电价改革取向和影响电价因素的分析,提出了对上网电价、输配电价和销售电价的短期、长期走势的预测。
为了探讨γ-氨基丁酸、谷氨酸、催乳素的含量与癫痫病的关系,我们应用放射免疫法测定癫痫患者脑脊液中γ-氨基丁酸、谷氨酸、催乳素的含量并与正常组对照.现将结果报告如下.
被誉为我国近代史上'西学第一'的严复,是第一个提出'教育救国'的思想启蒙家和教育家,他的体智德三育并重的思想、高度肯定体育的社会功能、肯定运动为强身主
近年来,为了发现新的具有更高生物活性的化合物,进而创制高效、广谱、低毒、对环境友好的绿色新农药,人们将研究重点放在杂环或含氟化合物,或二者相结合方面.杂环化合物在植
农村三资管理是农村经济健康发展的重要保障,当前的三资管理中存在着认识不足、制度不健全、管理不规范、管理人员水平不高等问题,影响了农村经济发展的速度。文章认为应针对