基于DNN的高鲁棒性低功耗语音端点检测设计

来源 :东南大学 | 被引量 : 0次 | 上传用户:bobby_hong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,越来越多的语音识别智能应用走入了大家的日常生活。语音端点检测(Voice Activity Detection,VAD)作为语音识别领域中必不可少的关键技术之一,其精确性和功耗在整个语音识别系统中起着十分重要的作用。从传统的VAD加速器所面临的非平稳噪声下精确度低、功耗大等问题出发,本文设计并实现了一种基于深度神经网络(Deep Neural Network,DNN)的高鲁棒性低功耗VAD。本文从VAD模型的算法特征出发,分别针对特征提取和语音分类做了算法优化和硬件实现。首先,优化了基于梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)的特征提取算法,并利用高鲁棒性DNN实现了快速傅里叶变换、离散余弦变换以及语音分类,提高了VAD在低信噪比和非平稳噪声下的性能,提高了语音和非语音命中率,实现了VAD的高鲁棒性;其次,引入数模混合近似计算,基于多阶量化共享乘法器实现VAD的动态精度可配运算,降低了运算复杂度和电路复杂度,实现了VAD的低功耗高能效。本文采用TSMC28nm工艺,VAD布局布线后的面积为0.52mm~2,工作频率为1.6MHz,功耗约为6~12μW,能效可达33.33~66.67TOPS/W。实验结果表明,本文通过优化VAD的算法和硬件实现,相比于Price等人的研究结果相比,精确度增长了9%,能效提高至Thinker的6.5倍,改善了当前VAD面临的功耗高和精确度低的问题。本文对VAD设计提供了一种新的解决方案。
其他文献
以甘肃少数民族自治地区2001-2013年数据为样本,借鉴了Cobb-Douglas和Lucas生产函数,利用“岭”回归和主成分回归分析方法进行了人力资本诸变量的参数估计。研究结果表明,物
目的:探讨尿酸酶溶栓治疗在急性心肌梗死急救中应用。方法:将83例时间窗内急性心肌梗死患者随机分为治疗组和对照组,两组均给予急性心肌梗死常规治疗,对照组在常规治疗基础上给予
我国义务教育学校现行的绩效考核制度距离现在有十年之久,已经不能适应目前的教育教学发展。实施绩效考核一方面是为了管理好教师,为职称评聘和绩效工资分配提供重要依据,另一方面是为了建设一支优秀的教师队伍,激励教师更加积极有效的工作。本论文以汕头市金平区公办小学教师绩效考核模式为例,重点以360度绩效反馈作为理论基础,通过文献研究法收集相关资料,通过调查研究法对汕头市金平区公办小学教师发放问卷并收集相关信
通过对土壤聚合物和硅酸盐水泥的耐酸性能的研究,表明土壤聚合物具有优异的抗酸性能,是在酸性环境中使用的理想材料,文中也对偏高岭土的活性分析和土壤聚合物的耐酸机理作了
ELISA检测人类免疫缺陷病毒抗体(抗-HIV)操作简单,灵敏度高,且已被广泛使用,但在实际工作中的影响因素较多,现就比较常见的影响作一些探讨.