论文部分内容阅读
现今集成电路设计的规模和能效都受到了传统芯片工艺的制约,而生活中日益增长的数据量却对芯片的性能和功耗提出了更加严峻的挑战,因此像近似计算这类新型低功耗、高性能的电路设计研究就显得尤为迫切。近似计算利用电路系统中的精度损失来突破原系统性能和功耗上的瓶颈,在各个应用领域中逐步得到广泛的研究。语音处理、机器学习、图像视频处理、模式识别等越来越多的应用对于计算中误差的容忍度较高,近似计算也因此表现出更多的可能性和适用性。本论文在充分分析传统FFT处理器设计瓶颈及其误差构成的基础上,引入位宽重组合的方式对FFT进行近似电路设计,并将近似FFT设计应用到语音识别系统的特征提取模块中重新训练、测试以检测近似设计在语音系统中的实际表现。本论文首先对多种近似DSP运算单元的研究设计进行总结对比,在现有FFT处理器经典实现结构的基础上,考虑利用不同的位宽组合实现一种精度可调的近似FFT设计。其次基于对传统FFT设计中资源分布的统计以及误差组成的分析,提出面积受限场景下的资源优化位宽选择算法和性能受限场景下的性能优化位宽选择算法,并论证了各自的结构特点和现实意义,再将两种选择算法推广到R2MDC、R4MDC、R4SDF和R2~2SDF四种经典的流水型FFT设计中进行测试。然后在FPGA平台下实现四种结构的FFT近似设计,测试了四种结构在不同误差容忍度下的系统误差、资源消耗和性能表现。资源、性能的优化结果表明在最大允许的误差范围下,四种结构经过近似设计后在资源上分别节省了37.8%、54.8%、60.2%和55.8%,在性能上分别提升了21.7%、56.9%、40.2%及18.0%。最后,本论文将所提出的近似FFT设计应用到语音识别系统的特征提取模块中,利用近似计算模块得到的特征矩阵进行模型的训练和测试。引入近似方案后,在最大设计误差下,语音识别系统准确率下降只有2%左右,而特征提取模块在资源上减少了38.9%。将近似模块提取到的特征矩阵与精确计算下的特征矩阵进行对比分析之后,结果表明不同语音的特征矩阵依然具有明显区分度。即使各语音特征矩阵之间的均方根差有所恶化,但同类语音间的均方根误差别仍然小于不同语音间的相应误差,在系统设计层面上验证了所提出的近似设计方案的实用性及可行性。