【摘 要】
:
语音关键词识别有助于实现更好的人机交互,但是对于低信噪比下的关键词识别性能,目前难以达到理想要求。本文从算法到硬件,实现了一套可应用于低信噪比环境的关键词识别方案。在算法上,实现了卷积加循环神经网络的语音关键词识别算法。第一,本文针对低信噪比的语音关键词识别,将传统的特征提取算法替换成单维卷积神经网络,规避了手工特征提取算法在低信噪比下的性能损失。第二,本文采用定点化量化训练方法,使得权重和数据都
【基金项目】
:
国家科技重大专项“面向智能计算的高能效精度可控近似计算单元及控制方法研究”(编号:2018ZX01031101-005);
论文部分内容阅读
语音关键词识别有助于实现更好的人机交互,但是对于低信噪比下的关键词识别性能,目前难以达到理想要求。本文从算法到硬件,实现了一套可应用于低信噪比环境的关键词识别方案。在算法上,实现了卷积加循环神经网络的语音关键词识别算法。第一,本文针对低信噪比的语音关键词识别,将传统的特征提取算法替换成单维卷积神经网络,规避了手工特征提取算法在低信噪比下的性能损失。第二,本文采用定点化量化训练方法,使得权重和数据都量化为8bit。在信噪比为-5d B的情况下,实现4个关键词的识别准确度可达87%,在信噪比为-5d B到20d B的混合语音关键词识别上准确率为87.3%。在硬件上,针对算法优化电路设计,降低功耗。第一,采用电路可重构,使得卷积、循环网络、全连接运算集中实现,规避了分部式架构带来的算力损失,使得每个乘法器的等效算力提高了36%。第二,硬件上对于非线性激活函数采用16段线性迭代近似方案,使得电路的复杂度得到极大的降低。第三,神经网络的乘加运算采用基于比特对编码的近似乘法与近似加法器设计,在确保准确率的情况下,使得乘法器与加法器的功耗降低了30%。本文电路设计采用TSMC 22nm工艺,进行布局布线后的面积为0.76mm2。当工作频率为4MHz可以实现对语音的实时处理,功耗约为7.4μW。
其他文献
随着装配式建筑体系的推进和发展,预制墙板配套砂浆得到了广泛的推广和应用,但现有的砂浆存在易开裂、收缩大和粘结性能低等一系列问题。本文针对装配式构件连接用材料的无收缩、高抗裂、高韧性等需求,研究水胶比、聚灰比、粉煤灰、固体养护剂和纤维对粘结砂浆性能的影响。结果表明,提高聚灰比和粉煤灰掺量可以有效降低砂浆的收缩,提高抗裂能力。降低水胶比和提高聚灰比可以提高砂浆的粘结性能,但会降低砂浆稠度。适量的固体养
在多式联运业务流程中,单证系统起着联结各多式联运参与方的重要作用。区块链作为近年来较为火热的研究方向,在信息系统构建与业务流程优化方面有巨大的探索空间。基于上述背景,论文探索使用区块链工具优化现有多式联运单证业务流程及基于区块链的多式联运单证系统的实现细节。首先,探索使用区块链工具对现有单证流程进行优化。通过基于现有单证业务流程和使用区块链工具优化后的业务流程分别建模,得到区块链技术在现有单证业务
第一部分TNFAIP3在人和大鼠正常及退变椎间盘髓核组织中的表达变化目的明确TNFAIP3及NF-κB通路相关信号分子在正常和退变椎间盘髓核组织中的表达变化。方法搜集临床人正常与退变髓核组织并采用免疫组化法观察正常和退变髓核组织中TNFAIP3表达变化;利用针刺法构建SD大鼠IVDD模型,分别提取正常与退变髓核组织的m RNA和蛋白(4周、20周、20周穿刺退变、50周),采用实时定量聚合酶链反应
目的:躯体症状障碍(somatic symptom disorder,SSD)是以一种或多种突出的令人痛苦的躯体症状为主要特点,同时伴与躯体症状或健康相关的不恰当的感受、想法或行为的一种精神障碍。SSD患者花费过多的时间、精力关注躯体症状而严重影响了日常生活和社会功能。本研究探讨SSD患者大脑白质(white matter,WM)结构和功能连接(functional connectivity,FC
飞行器如无人机(Unmanned Aerial Vehicle,UAV)等在生产生活中的广泛应用,让自主飞行控制变成飞行器领域的核心技术和重难点问题。如何设计实现高效优质的自主飞行控制系统成为新一代智慧飞行器设计制造的关键问题之一。目前大部分飞行控制研究关注的是低延时下的人为控制;或者是编制好任务路径以硬编码的方式让飞行器按照规划好的路径前进以完成任务。这两类飞行器控制技术均不能脱离人的控制和规划
由于具备体积小,价格实惠和控制稳定的优点,多旋翼无人机近十年来被逐渐广泛应用在各个领域,亦被广泛研究。其中基于单目视觉的无人机障碍规避是众多研究问题中有挑战性的问题之一,该研究对机载传感器要求低,且对于无人机小型化智能化,多传感器融合与灾备有重要意义。同时,在深度估计研究中所提出的自监督深度估计方法大幅度降低了构建数据集并训练对应场景下深度估计模型的难度,这使得基于单目深度估计的无人机避障具有高可
基于知识图谱的问答系统(KBQA)应用越来越广,用户提出的问题也更加复杂,通常包含多个查询意图,需要进行逻辑,定量,比较等聚合型的推理运算。语义解析方法是一种实用的方法,旨在将复杂的自然语言查询转换为机器可执行的逻辑形式(logic form,LF),再通过模块化的符号执行得到最终答案。训练语义解析模型通常需要大量专家标注的“黄金(gold)”逻辑形式。但是在实际应用中,获得这种逻辑标注的成本很高
背景:在过去十年中,埃博拉病毒病(Ebola Virus Disease,EVD)在非洲反复暴发,包括2014-2016年在西非的暴发以及2018-2020年在刚果民主共和国的暴发。这些暴发导致了不同的病死率和其他社会经济影响。尽管如此,关于该病的风险和影响的文献报道却很少,特别是孕妇和儿童等特定弱势群体的相关报道更是如此。目的:本研究旨在通过文献计量学量化并可视化2010-2019年期间发表的埃
粘胶纤维是再生纤维素纤维的一种,属于生物质纤维范围,是循环经济可持续发展的重要化学纤维产品。近年来国内粘胶行业产能快速增长,同行间竞争加剧,加之政府环保政策逐年收紧,如何提升传统产品的竞争力,加快高新产品的研发,是每个国内粘胶企业所面临的问题。FBE公司主营化学纤维制品生产和销售,整理车间负责将饼丝加工成筒丝,并进行分级、包装、入库工作,其生产管理能力的高低直接影响到公司产品质量的好坏,进而影响公
近年来,越来越多的语音识别应用进入到大家的日常生活中,其中关键词识别是语音识别应用领域必不可少的关键技术之一,而这些应用设备对低功耗和噪声场景下的识别精度要求很严苛,因此本文将提出一种面向高噪声场景的低功耗关键词识别特征提取的专用集成电路模块。本文主要从算法、电路两方面去优化设计,尽可能在保证识别精度的情况下降低关键词识别特征提取的功耗,主要工作包括:(1)基于传统梅尔频率倒谱系数(Mel Fre