基于音素后验概率的样例语音关键词检测方法

来源 :天津大学学报(自然科学与工程技术版) | 被引量 : 0次 | 上传用户:kick88888888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
低资源条件下的语音关键词检测是一个具有挑战性的问题,因为传统的基于大词汇量连续语音识别(LVCSR)的语音关键词检测方法不再适用.针对此问题提出了一种基于深度神经网络(DNN)输出层后验概率特征和改进的动态时间规整(DTW)算法的语音关键词检测方法.采用无监督高斯混合模型(GMM)和中、英文DNN音素模型得出的输入特征构建互补的子系统,并在SWS2013多语种数据集上进行实验.结果表明:相对于基线系统,分数层面的多语种、多系统融合能够有效地提升语音关键词检测系统的性能.
其他文献
工业中填料床往往处于湍流操作条件下,导致传质扩散呈现各向异性.针对填料床反应过程的预测,本文采用了雷诺质流模型,该模型的特点是通过直接求解雷诺质流方程来封闭湍流传质