论文部分内容阅读
说话人识别属于生物识别的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数来自动识别说话人身份的技术。在生物识别技术领域中,说话人识别技术以其独特的方便性、经济性和准确性等优势受到人们的关注。近年来随着DSP技术的迅猛发展及其性能的不断改善,用DSP来做语音实时处理也越来越受到人们的重视。基于DSP的说话人识别系统具有精度高、速度快、体积小、操作简单、成本低等特点。可广泛的用于司法、公安、机场、办公室等场所,具有非常广阔的应用前景。本文概述了说话人识别技术的概况及特征提取、模式识别等说话人识别的主要技术理论。详细地分析基音频率、线性预测系数、美尔倒谱系数等特征提取的理论和方法以及动态时间规整、矢量量化、隐马可夫模型、高斯混合模型等模式匹配算法的原理及过程。在此基础上,论文针对实际应用进行DSP嵌入式说话人识别系统的设计,并研究如何提高系统的可靠性、识别率、减少识别时间并实现系统的自举运行。系统在TMS320C6713 DSK上实现,采用美尔倒谱系数作为特征参数,以高斯混合模型作为识别模型。为了实现自举运行,模型参数存储在FLASHROM存储器中,以保证参数在掉电情况下不会丢失。系统充分的体现了人性化特点,设置了训练和识别的选择功能,并可进行说话人删除、补充、替换和更新工作;系统运行过程中,由DSP实验板自带的LED灯组合来显示系统的运行状态及最终的运行结果。考虑到识别时间、识别准确率,系统稳定性的要求并结合TMS320C6713 DSK开发板的性能和特点,系统的识别范围选定为10个人。经过测试,识别的速度可达3秒之内,准确率达98%以上。与其他系统相比,本系统在实现方法上加以一定的改进,保证了识别的准确率和系统的稳定性;减少了识别时间;实现了系统的自举运行;同时充分的体现出了系统可操作性,具有更大的实用价值。