论文部分内容阅读
针对汉语语音关键词检索任务中的集外词检索提出了一种基于局部声学信息的改进算法。在汉语语音识别和语音关键词检索任务中,由于集外词可以由词典内部的字词组合而成,因而通常认为不存在类似英文等语言中的集外词检索的问题。然而,由于数据稀疏问题,集外词在语言模型上建模不够充分,导致解码过程中难以存留下包含集外词的路径。本文根据深度神经网络在声学模型上建模的准确性,提出了在解码过程中利用令牌保存的局部声学信息以保留那些局部声学概率高而即将被剪枝掉的令牌,从而在词图中保留下来包含集外词的路径,提高集外词检索的召回率;然后