论文部分内容阅读
语音识别技术经过几十年的艰苦探索和研究,已经获得了极大的发展,并开始逐步应用于日常生活中。但语音识别技术中存在的一些问题,特别是儿童语音识别,成为阻碍该技术进一步推广的主要障碍。在我们的系统应用中发现84%的语音数据来自儿童,而成人语音训练的系统用于儿童语音识别时,识别性能会急剧下降。
本文开展的工作主要集中于儿童语音识别中的关键技术研究。概括起来有以下几个方面:
1.分析了儿童语音的特点。在已有的儿童语音数据库基础上,通过对儿童语音基频和共振峰的求取,分析了儿童语音与年龄变化的关系,指出了儿童语音与成人语音存在的差异。
2.研究了儿童语音自适应技术。对男声,女声和混合语音各自训练的模型进行了性能比较,并且将声道长度归一化的说话人自适应技术用于儿童语音识别,在此基础上提出了一种基于比例门限动态调整的办法,使识别率得到了进一步提高。
3.对人机语音交互技术与模块的研究。介绍了DSP平台,识别系统优化和对话管理等相关技术以及交互模块的应用。