论文部分内容阅读
语音识别技术经过多年的发展,现在开始逐渐走进不同的应用中。近年来,语言学习和口语发音检测的研究已经受到越来越多的关注,语音识别在计算机辅助语言学习中的应用成为一个重要的研究方向。特别是音频作为一种信息媒介,在人机交互过程中起到了重要的作用。本文提出一种利用语音识别技术,对母语为中文(L1)的英语(L2)学习者错误音素发音的自动检测系统。本文的方法通过预测语言学习者发音中可能导致错误发音的音素混淆规则来扩展标准发音词典,生成包含每个词的标准发音和可能错误发音变化的扩展发音词典,自动语音识别利用扩展发音词典来检测和诊断学习者的错误音素发音,并提供纠正反馈。音素混淆规则引用语言迁移的理论,我们通过系统的跨语言音系对比分析L1与L2之间在音素发音上的差异来生成,并采用数据驱动的方法:对学习者语音做自动音素识别,分析识别结果中所产生的错误发音与对应的标准发音之间的映射关系,来自动生成额外的音素混淆规则。在这种基于音素混淆规则的组合替换方法而生成的扩展发音词典中存在许多不合理的发音,为此,本文提出一种自动修剪的优化方法来提取其中合理而常见的错误发音。本文对21位英语学习者录音的实验结果说明,系统的检测结果在与专家标注文本的对比中,得到超过86%的一致率,经修剪后的扩展发音词典比完整的扩展发音词典能更好的检测错误音素发音。