论文部分内容阅读
统计方法处理口语至今仍然是口语处理的核心技术. 目前处理水平较高的英语,中文及日本语等语言均采用统计处理方法. 但是,各自语言存在独特的发音方式和文本构造,即使是采用同类方法建立语音-语言模型,由于语言本身的差异也会引起性能上的较大差异. 研究和定量分析这种差异对于新语言口语处理性能的改善将有很大帮助. 本文以蒙古语为例研讨了黏着性语言语音识别在使用不同结构语言模型时的识别精度. 结果显示和常用bigram模型和聚类模型相比,通过相似词分类后的聚类模型可以提高识别精度.