论文部分内容阅读
语音唤醒作为一种关键词识别(Keyword Spotting, KWS)技术,通常用作复杂语音交互设备的接口,是一种小型的关键词检索系统。随着物联网技术的发展,语音唤醒电路被广泛地应用在电池受限的移动、可穿戴设备中,并且保持常开(Always on)的状态,因此该类芯片对语音唤醒电路的功耗要求非常严格。
本文设计了一种极低功耗的语音唤醒电路,主要包括特征提取电路、神经网络电路和后处理电路。特征提取电路的设计基于改进的梅尔倒谱系数(Mel-frequency Cepstral Coefficients, MFCC)算法,通过调整算法执行顺序将数据维度从256降低到128,大幅度减少了串行快速傅里叶变换(Fast Fourier Transform, FFT)中的计算和存储量。其次,对特征提取电路实现细粒度的分级量化,压缩了数据的存储位宽,从而降低了电路实现代价。最后,根据特征提取电路的输出结果设计门控电路,对神经网络和后处理电路进行时钟门控。在特征提取电路的设计中保证了每一级算法的吞吐率,使电路统一运行在与采样频率一致的8KHz。
神经网络电路的设计采用二值化的深度可分离卷积神经网络(Depthwise Separable Convolution Neural Network, DSCNN)结构,逐帧计算的数据复用模式将计算量和存储量削减为复用前的 5.7%和 16.5%。其次,在神经网络电路中设计了可配置语音窗口,可以根据关键词的不同进行不同配置,提高了硬件设计的灵活性。除此之外,计算单元(Process element, PE)的设计可同时适用于多比特计算和单比特计算,并且使用基于原码的运算方式降低了单比特数据运算的电路翻转功耗。在后处理电路的设计中,使用ReLu函数代替传统的指数函数,在不影响准确率的前提下压缩存储和计算量。
本文对语音唤醒电路基于TSMC28nm工艺进行了近阈值设计,定制了基于极低漏电单元 register-file 的存储阵列,大幅度降低了电路的整体功耗。仿真结果表明,本文设计的语音唤醒电路对2个关键词的识别准确率为97.1%,整体电路功耗为0.47-0.93μW,达到了极低功耗的设计要求。
本文设计了一种极低功耗的语音唤醒电路,主要包括特征提取电路、神经网络电路和后处理电路。特征提取电路的设计基于改进的梅尔倒谱系数(Mel-frequency Cepstral Coefficients, MFCC)算法,通过调整算法执行顺序将数据维度从256降低到128,大幅度减少了串行快速傅里叶变换(Fast Fourier Transform, FFT)中的计算和存储量。其次,对特征提取电路实现细粒度的分级量化,压缩了数据的存储位宽,从而降低了电路实现代价。最后,根据特征提取电路的输出结果设计门控电路,对神经网络和后处理电路进行时钟门控。在特征提取电路的设计中保证了每一级算法的吞吐率,使电路统一运行在与采样频率一致的8KHz。
神经网络电路的设计采用二值化的深度可分离卷积神经网络(Depthwise Separable Convolution Neural Network, DSCNN)结构,逐帧计算的数据复用模式将计算量和存储量削减为复用前的 5.7%和 16.5%。其次,在神经网络电路中设计了可配置语音窗口,可以根据关键词的不同进行不同配置,提高了硬件设计的灵活性。除此之外,计算单元(Process element, PE)的设计可同时适用于多比特计算和单比特计算,并且使用基于原码的运算方式降低了单比特数据运算的电路翻转功耗。在后处理电路的设计中,使用ReLu函数代替传统的指数函数,在不影响准确率的前提下压缩存储和计算量。
本文对语音唤醒电路基于TSMC28nm工艺进行了近阈值设计,定制了基于极低漏电单元 register-file 的存储阵列,大幅度降低了电路的整体功耗。仿真结果表明,本文设计的语音唤醒电路对2个关键词的识别准确率为97.1%,整体电路功耗为0.47-0.93μW,达到了极低功耗的设计要求。