论文部分内容阅读
音频信号识别技术,包括语音识别、车辆声音识别、机械噪声识别、水声识别等都取得了很大的发展,但这些技术都还未达到令人满意的程度,关键是在于如何有效的提高识别准确率和识别设备的小型化。本文即立足于这两点,提出了一种改进的基于连续隐马尔可夫(CHMM)和BP神经网络融合的识别算法,并提出了一种基于FPGA和Nios II软核处理器的嵌入式音频信号识别系统的设计思想。在音频信号识别特别是语音识别领域内,随着隐马尔科夫模型(HMM)的应用,使得系统的识别性能有了改进,但是由于训练和测试环境(背景噪声、音频传输信道等)的失配常常导致识别性能的严重下降。根据人类的听觉感知机理,本文提出了一种改进的基于多带连续隐马尔科夫(CHMM)和BP神经网络融合的识别算法。多带CHMM系统由若干个子频带和一个全频带组成,系统对子带和全频带的特征分别进行训练,CHMM系统输出与音频信号帧平均能量共同作为BP神经网络的输入,并利用BP神经网络进行后端融合和判决。本文完成了基于Matlab的算法仿真,并与其他算法做了比较,本文还对传统的端点检测方法作了改进。随着音频信号识别技术的不断发展,除了识别算法的可靠性以外,人们还对识别设备小型化、便携化和可升级性提出了更高的要求,因此,在嵌入式系统中实现音频信号识别具有很大的实用价值。Altera公司的Nios II是基于RISC技术的通用嵌入式处理器芯片软内核,它特别为可编程单芯片系统(SOPC)设计了一套综合解决方案。本文提出了一种基于FPGA和Nios II软核处理器的嵌入式音频信号识别系统的设计方案,系统以Cyclone FPGA芯片为核心,采用软硬件结合的设计方式。由FPGA硬件完成对音频数据的预加重和加窗分帧处理等,由Nios II软核执行端点检测、特征提取、训练建模、识别匹配、输入控制和输出显示等。系统提取的音频信号特征为线性预测美尔倒谱系数(LPCMCC),采用动态时间规整(DTW)的识别算法。调试过程中,通过PC机串口将音频数据送入Nios II软核处理器,本文完成了软硬件开发和调试,基本实现了系统功能。