论文部分内容阅读
针对特定场合长音频语音识别结果错误率高,提出一种基于word2vec的语音识别后文本纠错方法。利用word2vec结合语境核心词生成关键词,使用深度语言模型对文本进行检错,利用拼音混淆集结合语义和语境信息对可能出错的词进行纠错。通过调用百度语音识别API进行实验,所提方法相比于其它纠错方法和不使用语境信息的纠错方法,纠错准确率、召回率、F1值得到了提高。