论文部分内容阅读
自从工业机器人投入应用以来,它已经在社会生产制造等许多领域中发挥了巨大的作用。目前,各种娱乐、示教、服务类型的机器人正在走进我们的日常生活,它们也将为我们的生活带来很多的方便和乐趣。语音一直是我们日常生活最惯常自然的信息交流方式,实现人机间的语音通信就显得必不可少,进行语音控制的研究工作具有很强的现实意义和应用前景。论文的主要工作是从特定人和非特定人两个方面对机器人语音控制问题进行研究。在特定人的语音识别技术方面,对经典的特定人的语音识别技术(即动态时间规整的语音识别技术,Dynamic Time Warping,简称DTW)进行了深入研究,针对两个方面的问题:1、传统DTW算法在语音识别过程中涉及到大量的计算会影响系统的响应速度;2、由于端点检测方法不能十分精准的判断语音信号的起始点,如果DTW严格对齐端点来匹配则会产生一定的识别误差。对此文章提出了结合搜索宽度限制和放松端点限制的方法对传统DTW算法进行改进,并通过实验验证了改进后的DTW在识别速度和识别率上都有很大的提高。其次,在非特定人语音识别技术方面,文章研究了现行最流行基于隐马尔可夫模型的非特定人语音识别技术。深入分析了算法的产生基础、思想、算法的三个基本问题及相应的解决方法。其中语音训练过程产生的语音模型很大程度上决定了系统的识别性能,因此文章结合了平滑模型参数技术和模型参数重估计方法对语音的模型参数进行了优化改进。实验结果表明对模型参数优化改进后能取得更好的语音识别效果。最后文章说明了机器人动作的设计过程,采用无线蓝牙技术实现了计算机和机器人之间的通讯,使机器人动作控制更具灵活性。在上述工作的基础上,结合VC++6.0和Matlab编程实现了对机器人特定人的语音控制,使用VC++6.0和HTK软件包编程实现了对机器人非特定人的语音控制,测试结果表明两者都达到了对机器人理想的语音控制效果。