说话人身份识别系统的设计及DSP实现

来源 :苏州大学 | 被引量 : 0次 | 上传用户:dddbj126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别属于生物识别的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数来自动识别说话人身份的技术。在生物识别技术领域中,说话人识别技术以其独特的方便性、经济性和准确性等优势受到人们的关注。近年来随着DSP技术的迅猛发展及其性能的不断改善,用DSP来做语音实时处理也越来越受到人们的重视。基于DSP的说话人识别系统具有精度高、速度快、体积小、操作简单、成本低等特点。可广泛的用于司法、公安、机场、办公室等场所,具有非常广阔的应用前景。本文概述了说话人识别技术的概况及特征提取、模式识别等说话人识别的主要技术理论。详细地分析基音频率、线性预测系数、美尔倒谱系数等特征提取的理论和方法以及动态时间规整、矢量量化、隐马可夫模型、高斯混合模型等模式匹配算法的原理及过程。在此基础上,论文针对实际应用进行DSP嵌入式说话人识别系统的设计,并研究如何提高系统的可靠性、识别率、减少识别时间并实现系统的自举运行。系统在TMS320C6713 DSK上实现,采用美尔倒谱系数作为特征参数,以高斯混合模型作为识别模型。为了实现自举运行,模型参数存储在FLASHROM存储器中,以保证参数在掉电情况下不会丢失。系统充分的体现了人性化特点,设置了训练和识别的选择功能,并可进行说话人删除、补充、替换和更新工作;系统运行过程中,由DSP实验板自带的LED灯组合来显示系统的运行状态及最终的运行结果。考虑到识别时间、识别准确率,系统稳定性的要求并结合TMS320C6713 DSK开发板的性能和特点,系统的识别范围选定为10个人。经过测试,识别的速度可达3秒之内,准确率达98%以上。与其他系统相比,本系统在实现方法上加以一定的改进,保证了识别的准确率和系统的稳定性;减少了识别时间;实现了系统的自举运行;同时充分的体现出了系统可操作性,具有更大的实用价值。
其他文献
红外成像具有较强的抗干扰能力,利用红外成像传感器实现目标实时跟踪己经成为精确制导武器的核心技术。机场作为重要的战略目标,不但在军事上有着极为重要的意义,而且是国民经济
学位
立体视频和传统的单通道视频相比,要处理翻番的数据量,为了便于存储和传输,立体视频数据必须要进行高效的压缩。H.264是新一代视频压缩标准,具有更高的压缩比,更好的信道适应
经典背压式算法解决了网络架构中的路由选择与会话调度问题,提高了网络吞吐量,但是由于其网络结构模型并没有完全的分层,使得其在实际部署过程中存在一些问题。目前所使用的