论文部分内容阅读
随着移动互联网的发展,移动平台上英语口语学习软件越来越丰富,在移动端为用户提供正确的发音指导也越来越重要。传统的英语口语学习系统一般使用隐马尔可夫(Hidden Markov Model,HMM)模型或神经网络(Artificial Neural Network,ANN)模型进行识别,但是HMM模型固有的限制会导致系统性能不能进一步提升;ANN虽然具有强大的分类能力,但是在处理长时依赖的问题上会出现误差信号消亡的问题。如何解决上述问题提高语音识别的正确率并开发移动平台上的英语口语学习软件具有重要意义。 本文提出一种新型的长短型记忆(Long Short-Term Memory,LSTM)网络,它能解决传统神经网络模型在训练时产生的误差信号消亡的问题。主要工作包括:一、描述 LSTM递归网络的构成和学习算法,LSTM网络采用恒定误差传播单元(Constant Error Carrousel,CEC),保持误差信号的后向传播,提高语音识别率;二、研究开源工具包Currennt,Currennt采用CUDA(Compute Unified Device Architecture)并行编程实现LSTM网络的训练与识别,大量减少了程序的计算时间,为了使Currennt在移动平台上运行,本文探索了Android系统对并行计算的支持,并将Currennt中解码部分的代码改为串行执行;三、使用Android NDK开发工具,实现将Currennt的解码功能在Android平台上运行,并优化了算法,提高了程序在Android平台上的执行速度。 通过将 LSTM网络应用到语音识别中,提高了实验室英语口语学习系统的识别率;LSTM网络在Android平台上的实现,将系统的运行拓展到移动平台上,更加方便用户的使用。