论文部分内容阅读
本文研究汉语语音检索中基于音节和词语言模型的索引方法。首先介绍利用音节Lattice建立索引的方法,采用了基于后验概率的置信测度。之后在使用相同声学模型和语言学模型训练语料的情况下,分别使用音节语言模型和词语言模型进行解码,得到含有不同基元的Lattice。将含有多音节基元的Lattice拆分成只含有单音节基元的Lattice,用其作索引有效地避免多音节基元影响OOV 词检出的问题。最后对利用两种语言模型生成的Lattice进行规模、错误率和词检出性能评测。与只用音节语言模型的Lattice索引相比,利用词语言模型生成的Lattice经转换之后得到的索引,表现出更好的词检出性能。