论文部分内容阅读
论文对统计语言模型进行了简要介绍,对利用统计语言模型中的隐马尔科夫模型实现音字转化应用进行了详细的讨论。围绕着如何高效的实现Viterbi Beam搜索,以及如何更有效的利用存储空间。论文讨论了完成音字转换所需要的参数,并解决了要完成整句输入法的参数数据来源问题;通过反复设计存储方案来实现高效的查询工作,以满足音字转化应用的需要。在论文最后,给出了利用不同的数据平滑算法对正确率的影响。本论文试图将语音识别中的隐马尔科夫模型应用到拼音输入法上,并因此对其进行相应的模型修改,同时在匹配阶段以词为单位进行匹配,是本文的亮点。