【摘 要】
:
随着现代科技的进步,智能化语音设备走进了千家万户,语音关键词检测技术也成为人机交互的重要组成部分。随着深度学习逐步渗透到各个领域,基于深度学习的语音关键词检测算法凭借其强大的计算能力以及更高的准确性超越经典语音关键词检测算法成为主流,然而由于实际应用时环境噪音等因素对语音的影响比较大,以及面对未知数据时会出现神经网络对自身产生的预测结果过于自信,导致当前语音关键词检测方法对其产生错误的判断结果的情
论文部分内容阅读
随着现代科技的进步,智能化语音设备走进了千家万户,语音关键词检测技术也成为人机交互的重要组成部分。随着深度学习逐步渗透到各个领域,基于深度学习的语音关键词检测算法凭借其强大的计算能力以及更高的准确性超越经典语音关键词检测算法成为主流,然而由于实际应用时环境噪音等因素对语音的影响比较大,以及面对未知数据时会出现神经网络对自身产生的预测结果过于自信,导致当前语音关键词检测方法对其产生错误的判断结果的情况,尤其预定义关键词内外的数据量严重不平衡,当待检测语音数据为预定义关键词之外的词汇时,检测模型会产生大量的虚警,严重影响用户体验。另一方面,适合资源有限的小型终端设备使用的轻量型关键词检测模型更容易受到预定义关键词之外词汇和环境噪音等因素的干扰而产生大量误报虚报,无法满足语音关键词检测系统实时性高、鲁棒性强的要求。针对上述问题,本文提出了两种优化方法用于提高基于深度学习的语音关键词检测方法的置信度,改善模型性能。首先,提出了一种基于三元组置信度分支的语音关键词检测方法,通过一个结合注意力机制的置信度分支学习对每个预测结果进行置信度估计,并利用置信度估计值客观度量预测结果的可靠程度,再结合注意力评分机制更准确有效地提升检测模型的置信度估计能力,降低检测模型的虚警率。另一方面针对语音关键词较为短小且存在发音相似的现象,在卷积循环网络的基础上引入三元组损失促进网络学习关键词类别之间的关系,同时提升了模型处理可变长度序列数据时的性能,并通过与最先进的方法对比和消融实验分析,证明了本文提出的基于三元组置信度分支的语音关键词检测方法可以有效提高关键词检测模型的精度。其次,提出了一种基于知识蒸馏的语音关键词检测方法,探讨了师生网络对预测结果及其置信度的排序关系,将置信度估计能力作为一种知识由教师网络传递给学生网络,使轻量型学生网络能够为正确预测结果生成高置信度、为错误预测结果生成低置信度来区分正误预测结果,提高轻量检测模型的拒识率。另一方面使用注意力机制动态获取师生网络之间合适的中间层特征连接方案以及知识蒸馏的强度,使得知识迁移的效果最大化,最后通过实验证明了该方法可以有效提升适合小型终端设备等多种场景使用的轻量关键词检测模型的准确率。
其他文献
高光谱图像蕴含着丰富的地物特征信息,不仅保留了图像的空间信息,还获取了高分辨率的光谱信息,可以有效实现多特征融合,挖掘出地物的本征特性,利于对地物的定量分析和精细分类。然而高维度的高光谱图像数据存在着非线性分布、冗余度高等亟需解决的难点。因此,对高光谱图像进行特征提取,以获取有效的低维特征,使得后续分类更为高效且准确,是目前研究的热点。本文利用高光谱遥感图像的多种结构信息进行研究,基于统计理论、流
为了应对能源紧缺、环境污染和全球变暖等问题,亟需开发高储量、低损耗的新能源储能技术。与电化学电池、超级电容器相比,聚合物薄膜电容器具有充放电速度快、功率密度高、循环寿命长、灵活性和可靠性强等特点,不失为电力电子和脉冲电力系统的理想选择。然而,目前商用的薄膜电容器材料(BOPP)的介电常数和储能密度较低,通常在电子和电气系统中占据很大体积,难以满足小型化、集成化的要求。所以,探究并开发兼具高击穿场强
农业农村农民问题是关系国计民生的根本性问题。党的十九大做出了实施乡村振兴战略的重要部署,这是党中央着眼于推进“四化同步”、城乡一体化发展和全面建成小康社会做出的重大战略决策,是加快农业农村现代化、提升亿万农民获得幸福感、巩固党在农村的执政基础和实现中华民族伟大复兴的必然要求。全面建成社会主义现代化国家、实现中华民族伟大复兴,根基在于实现乡村振兴;而要实现乡村振兴,建设完善的、现代化的往村覆盖、往户
从辅路的功能入手,对现有部分道路辅路设计存在的问题进行了分析,提出了保证足够宽度、设置公交车道、组织好车辆的换道、关注交叉口设计、管网尽量布置在辅路、规范辅路行道树栽植、人行道侧增设非机动车道等辅路规划设计策略。基于此,论文以某市城市干道辅路规划设计为例,进一步诠释了辅路规划设计策略。
新雇佣关系下从雇佣制度到雇佣关系均发生变化,主要体现在劳动者自身认知变化以及职场从单一到多元化发展等方面。随着劳动者认知提升、雇佣制度内涵愈加丰富等变化,用人单位利用末位淘汰违法变更或解除劳动合同的实施方式愈加隐蔽,试图以此达到规避监管的目的,在此背景下末位淘汰制度合理性与合法性遭受质疑,劳动者权益日渐遭受侵害。但末位淘汰并非一无是处,其在提升劳动者积极性、实现岗位匹配等方面均具有正面意义。本文围
为降低船舶靠港产生的污染各国陆续引进岸电输电技术,其中岸电电缆作为岸电供电系统关键设备之一,其良好的电气、机械性能是保证岸电供电系统安全稳定运行的前提。由于长期工作于港口地区,岸电电缆易长时间受到太阳辐射、潮水的涨落等环境因素的影响,同时其运输过程易受到拉伸、弯曲、扭转等外力的作用,导致岸电电缆的运行寿命远远小于传统电缆。因此本文研究了在不同环境条件以及典型缺陷下岸电电缆内部多物理场分布的解析计算
过氧化氢(H2O2)在生物体内的代谢活动中起着至关重要的作用,但过高浓度的H2O2会引发多种重大疾病,因此实现原位实时检测活细胞释放的H2O2至关重要。然而活细胞释放的H2O2微量且不稳定,让原位实时高度准确且灵敏地检测具有较大的难度。在众多快速检测方法中,电化学具有特异性好、灵敏度高等优点为解决这些问题提供了一种途径。此外,基于柔性导电碳布(CC)的电化学传感器可以实现细胞的原位生长。并且将具有
永磁同步电动机能实现高效率的机电能量转换,利用算法代替编码器获取电机转子位置的控制方案能够应对电机工作环境、安装空间受限问题,提升电机运行性能和可靠性。本文以表贴式永磁同步电机及其无位置传感器驱动系统为研究对象,针对其中存在的启动、动态性能问题和转速估计误差问题,利用复合观测器算法在控制系统性能表现以及负载转矩参数估计等方面进行改进研究,设计了能够实现表贴式永磁同步电机宽速域运行、任意位置启动的无
自主巡检机器人可实现设备状态的全面监控,为制造车间的无人化运作铺平道路。车间占地面积大、环境复杂,传统的引导式导航定位方法过度依赖外部环境改造,维护成本高,且难以实现自主导航。基于同时定位与建图技术的移动机器人定位方案可以构建车间场景的尺度地图,进而实现地图中的准确定位与自主导航。本文面向车间巡检场景,围绕移动机器人室内激光SLAM与重定位系统的关键技术展开研究,内容包括:(1)惯性轮式里程计位姿
镁合金因其具有高强度、高模量、轻质化等优点,在交通载具、航空航天和电子产品等工业领域得到广泛应用。Mg-RE-Al-Zn系合金因具有独特的结构和优异的综合力学性能成为了镁合金研究中心的热点。本文以Mg-Y系合金作为基础,设计制备了Mg-11Y(WAZ00)、Mg-11Y-0.5Al、Mg-11Y-1.0Al(WAZ10)、Mg-11Y-1.5Al、Mg-11Y-1.0Zn(WAZ01)、Mg-11