基于FPGA的嵌入式系统说话人识别算法的研究与实现

来源 :重庆大学 | 被引量 : 0次 | 上传用户:crazy5555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是指通过对说话人语音信号的分析处理来自动识别说话人的身份,它在许多领域内有着良好的应用前景。本说话人识别系统是建立在基于FPGA的嵌入式系统之上的,采用了矢量量化的方法,它包括三个主要模块:特征提取、模式匹配和硬件平台。在特征提取过程中,将从说话人的语音信号中提取能够体现个性特征的少量参数,并对提取算法以速度为优先指标进行优化。在模式匹配模块中包含两个部分:一是码书生成步骤,二是识别步骤。在硬件平台模块中,将利用FPGA设计一个SOPC系统,以完成语音信号的采集、人机交互接口等功能,并利用FPGA的并行处理特性对模式匹配的算法进行加速。本文首先在对语音信号的时域处理方法进行研究的基础上,对常用特征参数提取原理和特点进行研究,其中,重点研究了美尔频率倒谱系数的原理和特点,设计和实现了提取步骤。然后,在对主流模式匹配方法的研究基础上,重点研究了矢量量化的方法,并在介绍了矢量量化的原理和失真测度的基础上,研究矢量量化器最优码本设计的算法—遗传算法。接着,对本系统所使用的基于SOPC的硬件平台进行了设计,并设计和实现了硬件模块与软件系统的接口。最后,设计了一套以MFCC为特征参数、以遗传算法为码本设计算法、以矢量量化为模式匹配方法的说话人识别算法,在基于FPGA的嵌入式平台上实现,并对算法进行一系列的软、硬件优化,同时,提出了一种新的失真距离计算方法—分段均值距离法,通过在实际硬件平台上的实验,得出了在增大各码本失真距离间距方面有着较好的效果的结论。本系统采用美尔频率倒谱系数特征参数,提高了系统的识别性能;采用遗传算法进行码书设计,并利用K-均值聚类算法加快码书收敛速度,优化了码书性能;采用分段均值距离法获得较稳定的阈值,提高了系统的拒识率。本系统获得了很高的识别率和拒识率,并具有运算速度快、差错率低、系统硬件要求较低等优点,具备了一定的实用化能力。
其他文献
会计师事务所采用的组织形式对审计质量的影响已经越来越引起关注,如何健全和完善会计师事务所的组织形式,优化会计师事务所的运行机制以提高审计质量,是当前的重要研究课题
增值税,顾名思义是对商品生产、流通、劳务服务中多个环节的新增价值或商品的附加值征收的一种流转税。增值税兴起于法国,以其明显的优势在全世界得到迅速推广。1979年我国正
20世纪初,国内外不断出现的财务舞弊事件引起了人们的重视,国内外官方机构纷纷出台各种政策来应对舞弊现象,其中美国在2002年颁布了《SOX法案》,标志着内部控制信息进入强制
目的分析和探讨中医特色护理对肝硬化患者临床疗效与生活质量的影响研究。方法将2017年4月~2019年1月时间段内在我院消化科就诊治疗的肝硬化患者90例,按照就诊顺序及患者意愿
为实现页岩气早见效、早开采、早收益,往往在压裂结束后,立即启用地面排采流程排液,见气后立即倒入生产管网输气。但试采性质的排采流程的设计和配套不能完全满足开采作业的
产生正外部效应的企业的实际产出往往低于最适产出,该类企业如何在互联网背景下突破产出与存续需求的矛盾仍未可知。采用扎根理论研究法,对“涓涓互助”公益互联网平台的价值
微型真空电子器件近期得到了蓬勃的发展,这种器件的小型互作用电路的研发也取得了令人瞩目的成果,已经成为当前真空电子学领域的研究热点。微型真空电子器件充分结合了微波真
在本文中分别对发射波长在中红外光谱区域的量子级联激光器和带间级联激光器进行了细致的研究,给出这两类新型半导体激光器的基本原理和采用的外延生长方法,根据所翻译的英文
随着通信技术的高速发展以及军事与民用两方面对传输信息的更高要求,当今的纠错码技术已经不能仅仅在理论上探讨问题,必须进一步的提升到实际应用当中去,并且已经成为大部分通信
<正>纯系抗病草鱼是湖南师范大学生命科学院鱼类发育生物研究所,经过多年精心培育,成功培育出的抗病草鱼。该草鱼具有抗病能力强、生长速度快、成活率高等优点,其示范推广现