孤立词语音识别系统关键模块的设计

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:jtk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
端点检测是孤立词语音识别系统中的一个关键问题,孤立词语音识别系统必须先进行端点检测,减少数据量和运算量,从而减少处理时间。语音信号经过预处理、特征提取后,各产生一个或者几个模板,识别阶段将待识别模式的特征序列与各个模板进行相似度计算,然后判别属于哪个类。因此对端点检测算法和模板匹配进行研究有重要意义,同时为了实现语音识别芯片的低成本化,基于ASIC方式的语音识别系统的设计也是非常必要的。本论文在深入分析语音识别系统中的关键技术基础上,重点对特定人孤立词的ASIC中的端点检测和模板匹配模块结构进行了设计。首先,研究了基于短时能量、倒谱特征和双门限语音信号端点检测算法,并对模板匹配中常用的动态时间规整(DTW, Dynamic Time Warp)算法进行了研究。通过MATLAB搭建孤立词语音识别系统,对这三种端点检测算法和一般DTW和高效DTW算法进行了比较,最终选择了双门限端点检测算法和高效DTW算法。其次,综合前期研究成果,将基于短时能量和过零率的双门限端点检测算法,线性预测特征提取和高效DTW相结合,提出了孤立词语音识别系统的设计方案。该方案将这三种算法的优点充分结合,使得系统在保证较高的识别率的前提下,系统的运行时间也得到了控制。最后,采用FPGA作为系统开发平台,用Verilog编写RTL代码实现整个系统的硬件电路设计。在保证识别效果的情况下,降低了系统成本。结合前期研究成果,提出了基于短时能量和短时过零率的加权门限端点检测算法,并通过了软件仿真,验证了其功能。实验结果表明,采用本文的关键技术搭建的孤立词语音识别系统的语音信号的采样频率为8KHz,每次采样的数据为8bits。在100个词源的条件下,平均可以达到81%以上的识别效果。
其他文献
无线通信技术的迅猛发展对模数转换器的精度和速度有了更高的要求,而基准源作为模数转换器中的重要模块,其输出特性直接决定了模数转换器的整体性能。因此,针对当前模数转换器精
蛙皮素—蜂毒素杂合肽是一种具有抗菌活性的碱性多肽物质,属于人工构建基因经诱导表达的一种抗菌小肽。实验表明,杂合肽虽然具有抗菌活性,但由于其分子量较小(约2.9KDa),加上其在大
Ni–48.5at%Ti thin films were irradiated in the austenite phase by different energy-level protons at a dose rate of 1.85 × 1012 p/(cm2·s), and the total dose
本文设计了以TMS320F2407 DSP为控制核心,三相异步电机为研究对象的直接转矩控制系统。首先从三相异步电机的工作原理入手,深入分析了直接转矩控制系统中电压矢量与磁链和转矩的关系,介绍了磁链和转矩的控制方法,给出了最优电压矢量选择方案。利用MATLAB仿真工具对整个系统进行了仿真,证明了系统的正确性和可靠性,针对启动电流大的问题设计了控制转矩电流的并行启动方法,达到了减小启动电流的目的。最后
台积电宣布2020年的资本开支是150到160亿美元,其中80%将投向先进产能扩增,包括7nm、5nm及3nm.这次说法会上台积电没有公布3nm工艺的情况,因为他们4月份会有专门的发布会,会公
期刊
The present study aimed to investigate the durability and microstructure evolution of road base materials (RBM) prepared from red mud and flue gas desulfurizati
Column leaching experiments with ion adsorption-type rare earth ores for different lixiviant concentrations and different column heights were carried out. A mat
我国是一个少油少气多煤的国家,煤炭的消费比例大约占能源总体消费水平的70%左右,其中工业锅炉消耗原煤占中国能源消费总量的18%。然而目前我国运行的大多数锅炉系统长期处在