智慧家庭环境下语音交互系统的设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:maomao1t
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,为了满足人们对智能家居设备便捷化的控制需求,智能语音软件和交互设备逐渐走进了人们的家庭生活。现有软件和设备的语音识别功能都基于云端完成,存在无法离线使用、占用网络带宽、隐私泄露等问题。论文对语音识别理论展开研究,设计和实现了智慧家庭环境下基于语音的自然人机交互系统。系统包含两个部分,关键词识别系统和大词汇量连续中文语音识别系统。关键词识别系统用于设备唤醒和短指令识别,在资源受限的微控制器端运行。论文从参数量、识别率和推理阶段计算量三个方面,研究和比较了深度全连接神经网络、卷积神经网络和深度可分离卷积神经网络在关键词识别任务中的应用。为了实现关键词识别模型在微控制器端的部署,论文使用动态定点量化进一步降低模型存储需求,同时使用SIMD指令加速模型在微控制器端的推理运算。大词汇量连续中文语音识别系统用于长语句识别,运行在搭载Intel Movidius神经网络计算棒的控制中心节点。本文的端到端连续语音识别模型能够直接将音频转为文本,无需中间音素表示。模型结合卷积神经网络、双向长短时记忆神经网络和连接时序分类,在输入梅尔频率倒谱系数特征序列与输出拼音序列之间建立映射关系,并使用N-gram语言模型结合维特比算法将拼音转为汉字。论文实现的关键词识别模型能获得93.5%的识别率,SIMD指令能将模型在微控制器端的运算时间降低约70%。大词汇量连续中文语音识别系统在无语言模型辅助解码时够获得81.7%的识别率,加入N-gram语言模型后,识别率提高为84.4%。
其他文献
<正>中华人民共和国水利部2015年6月2号发布2015年第44号水利部公告,批准SL709—2015《河湖生态修复与保护规划编制导则》为水利行业标准,该标准将于2015年9月2号实施。《河
"梦"是庄子"虚化"哲学思想的一个表现。庄子将自己的独特见解以"梦"的虚幻来表现,表达他对社会、人生的思考,极具真实性而又富有人生哲理。对庄子的"梦"进行解析,有助于理解庄子的哲
今年初以来,中国房地产市场出现了一轮非常猛烈的恢复。本文通过样本分析认为:反腐败和房地产市场表现有关系,当前房地产市场核心的问题是去存货,而反腐败短期之内加速房地产
目前,随着世界金融界一体化趋势不断加强,我国的保险业也呈现出集团化发展的趋势,许多保险企业在保险业务的基础之上不断向多元化发展,国内现有的几家保险集团和类保险集团毫无疑
高校辅导员工作任务重、工作压力大、职业地位和薪酬待遇低,这些问题与目前高校辅导员的职业定位上有一定关联,从职业定位上分析了当前辅导员生存现状,提出在高校辅导员在职业发
本文对富水卵石地层地铁联络通道冻结法施工的温度场进行了相关研究,由于富水卵石地层的各项物理系数与黏土层等其他土层并不相同,而现阶段有关富水卵石地层的冻结法施工研究
为了迎接即将到来的"第七届世界军人运动会",武汉市多处在进行改造与修建。主要包括:军运会赛事场馆建设及改造、道路拓宽维修改造、重要路段路边建筑物及老住宅区拆迁维修改
一般而言,生态建设往往因需要大量投入而难以见到经济效益而缺乏动力。重庆开县以系统思维对汉丰湖进行生态治理:一是实施以改善水质为目标的系统生态治理,改善森林生态、农
目的探讨维生素D受体在内毒素感染时对肝脏的保护作用。方法随机抽取C57 BL/6源性的野生小鼠10只和维生素D受体(VDR)敲除小鼠10只,分为对照组和实验组,实验组LPS 15 mg/kg腹腔
近年来,我国医疗费用的持续大幅增长受到持续关注,"看病贵"的问题成为我国政府亟需解决的重要议题。医疗费用,作为医疗改革的重要组成要素,受到多方面因素的影响。通过建立多