基于轻量化神经网络的语音识别声学模型及其在机器人中的应用

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:kamael1234567890
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,语音识别得到了广泛的研究和应用,将神经网络应用于声学模型能取得更佳的系统性能。但是,在实际应用中,硬件能提供的计算能力和存储能力有限。因此,在保证语音识别系统性能的同时,如何使其适配小存储、低算力的硬件设备成为需要研究和解决的问题。为此,本文研究了两种轻量化神经网络,将其应用于声学模型,搭建并优化了适配机器人硬件设备的语音识别系统。首先,将稀疏性神经网络应用于语音识别声学模型。提出了步进裁剪方法,该方法通过特定的评价指标判定神经网络中神经元作用的大小,通过修剪、重新训练的方法得到轻量化神经网络。在华尔街日报语音数据集上验证了该方法,在系统性能仅略微降低的情况下,使声学模型大小从77M减小到21M,大大减小了语音识别系统所需的存储和算力。其次,研究了结构增长型轻量化神经网络。与稀疏性神经网络的思路相反,结构增长型神经网络通过逐渐增长小型神经网络结构的方法来控制神经网络的大小和性能。针对语音识别的实际应用场景,在Ada Boost算法的理论基础上,提出了一种新的Con Boost结构增长型轻量化神经网络。在华尔街日报语音数据集上验证了该方法,结果表明Con Boost算法使神经网络以更少的连接数,反而得到了8.2%的性能提升。然后,设计和搭建了适用于机器人上硬件设备的语音识别系统。在上述研究的基础上,针对机器人提供的硬件设备,利用所提的Con Boost结构增长型轻量化神经网络,以及基于Kaldi语音识别工具包,设计和优化了语音识别系统,包括特征处理模块,以及由声学模型、词典及语言模型组合而成的解码器。其中声学模型大小仅为9.9M,满足硬件需求。最后,对全文的研究工作进行了总结,提出了几点值得深入研究的方向。
其他文献
随着智能可穿戴设备的日益流行,压力传感器作为实现力—电信号转换的核心器件受到了越来越多的关注。本文结合了高度压力敏感的MXene/石墨烯复合传感材料和新颖的中空微球器件结构设计,制备了一种新型压阻式压力传感器。相比于现有的基于碳纳米材料和气凝胶的压阻式传感器,器件在压力探测灵敏度和线性检测范围方面均有较大的提升。该传感器具备如下特点:(1)传感性能优异:器件具备较高的探测灵敏度(6.4–10 k
随着计算机技术和机器人技术的发展,新型的隐式人机交互技术打破了传统的机器被动接受人指令的程式控制方式,而以一种对人的交互意图主动进行理解的方式存在,如语音识别、手势识别、机器人自动编程等。在机器人应用领域,本文基于生物电的穿戴式人机交互技术为实现隐式人机交互的主要方式之一。由于这种方式具有交互自然方便、应用操作简单易用以及可以对动作进行预判性理解等优点,被作为新型交互前沿技术,广泛应用于高级机器人
随着社会的发展,用电需求量的增加,汽轮机组的容量朝着大型化发展。护环是汽轮机组核心部件,承受来自转子转动的迭加载荷,服役于潮湿腐蚀性环境,因此护环应具有足够高的强度,良好的韧性、较小的残余应力以及奥氏体无磁性,其性能的好坏直接影响汽轮机组安全稳定运行。然而护环钢在生产使用过程当中面临两大问题,一是在后期热锻过程中容易开裂,造成成材率低,难以批量生产。二是抗腐蚀性能较差,在服役过程中,护环由于抗腐蚀
随着人们在工作和生活中对电子产品的依赖和需求逐步增大,电子产品的更新换代速度加快以致被淘汰的废弃电子产品数量与日俱增。在资源与环境问题日益凸显,消费者的环保意识逐渐增强的背景下,各国政府有关部门开始高度重视制造型企业的回收再制造活动。在政府要求节能减排、实现可持续发展的背景下,制造型企业的生产决策需要面对政府奖惩机制的约束和异质消费市场的选择。再制造品相对于新产品可以节省40%~65%的成本和85
锂离子电池(LIBs)因具有能量密度高、循环寿命长以及环境友好等一系列优点,现已被广泛应用于电动汽车和便携数码设备等领域。然而,现今市场上存在的商品化LIBs大多由液态电解质组装而成。当LIBs发生内部短路、过热等情况时,极易引燃电解液,进而导致电池起火爆炸,造成严重的安全隐患。开发固态聚合物电解质以解决LIBs实际应用期间液态电解质存在的诸多不足,其良好的机械性能以及自身稳定的电化学性质能有效改
燃料电池是一种按电化学原理等温地把贮存在燃料和氧化剂中的化学能高效环保地转化为电能的发电装置。燃料电池种类繁多,其中质子交换膜燃料电池(PEMFC)具有启动快、比功率高、结构简单等优点,是各种车载电源和便携式电源的首选能源。然而质子交换膜存在着制备方法复杂、机械性能较差、吸附磷酸后溶胀比较严重、材料价格昂贵等不足之处,限制了质子交换膜的发展和应用。本论文针对上述质子交换膜存在的问题,采用交联、有机
水下液压运动平台作为水下发射技术研究过程中的试验装置,肩负着进行模型试验的重要使命。显然,试验装置性能的好坏将决定试验的准确性和有效性,对整个研究过程的经济性、高效性和可靠性产生直接影响。液压传动作为一种应用广泛的机械传动方式,由于其布局灵活、传动功率大、可无极变速等优点,尤其适合作为本文所研究的水下液压运动平台这种大型装置的动力机构。试验的精确性对液压系统的控制提出了较高要求,采用合适的控制策略
角度测量作为计量技术中的一个十分重要的部分,到目前为止发展已经相对完备,各种用于检测其精确度的手段较为丰富。与传统的角度测量方法相比,光学测角法有着非接触式、高测量精度等多方面的优势。在三自由度角度测量中,测量滚转角的方法由于滚转角角位移方向与光轴垂直而与俯仰角、偏航角的方法不相适用,这也使得一些光学角度测量方法应用场合受限。针对以上问题,本文首先提出基于斯托克斯偏振仪的绝对式滚转角测量方法,该方
激光测距是当前智能设备的核心技术之一,随着科技和工业信息化的不断推进,它正不断成为限制诸如地图测绘、自动驾驶、机器人定位等领域发展的关键技术瓶颈。为进一步提高测距精度、优化电路结构、降低设计难度与设计成本,本课题以相位式激光测距技术为背景,研制了基于“双发单收”探测模式的高精度、低成本激光测距系统,主要研究工作包括:(1)设计了基于“双发单收”模式的双光路探测技术方案,建立了该模式下待测距离与双光
面向室内服务场景的协作机器人通常需要完成取送物体的任务,然而室内场景非结构化、动态变化的特点给协作机器人准确抓取物体带来很大挑战。同时,对部分人机协作任务,人机安全至为重要。目前,针对协作机器人物体抓取和主动安全的研究仍然沿用工业机器人结构化场景的处理模式。此模式没有考虑背景复杂、物体遮挡、光照变化等带来的影响,难以满足室内服务场景的需要。所以本文针对面向室内服务场景的协作机器人,研究并提出了一套