【摘 要】
:
随着现代科技的进步,人们不仅需要语音作为人类互相传递信息的手段,为了更加方便人们的生活生产,还需要人与机器之间可以通过语音传递信息。这其中重要的一环是使得机器能够听懂人类的语音,为了满足这种需求,语音识别应运而生。在实际的语音识别过程中,往往处于噪声环境下,如本文所要解决的在噪声环境下智能挖掘机器人的语音识别。由于噪声对语音输入特征的影响,使得语音识别的正确率会出现大幅度的下降。为了满足工程需要,
论文部分内容阅读
随着现代科技的进步,人们不仅需要语音作为人类互相传递信息的手段,为了更加方便人们的生活生产,还需要人与机器之间可以通过语音传递信息。这其中重要的一环是使得机器能够听懂人类的语音,为了满足这种需求,语音识别应运而生。在实际的语音识别过程中,往往处于噪声环境下,如本文所要解决的在噪声环境下智能挖掘机器人的语音识别。由于噪声对语音输入特征的影响,使得语音识别的正确率会出现大幅度的下降。为了满足工程需要,同时考虑工程安全性,本文制定的方案是识别指令词,在学术上也称为孤立词识别。首先,针对噪声环境下的语音识别模型,本文介绍了经典的HMM-GMM模型和基于GRU的LAS模型,这两个模型都是基于序列推理的方式进行语音识别。考虑到噪声对语音信号的影响,造成推理错误从而导致整个语音识别任务失败。本文提出了使用基于图像识别的指令词语音识别模型,即卷积神经网络(Convolutional Neural Network,CNN)模型。将语音信号处理成图像,利用CNN模型对图像中的噪声容限能力强的特点,实现了噪声环境下智能挖掘机器人的指令词语音识别问题。其次,通过分析实际工程,得出需要完成噪声环境下智能挖掘机器人在线指令词语音识别。在噪声环境下,进行在线语音识别需要语音端点检测,即从噪声信号中辨别出语音信号。针对噪声环境下在线语音端点检测,本文提出了基于CNN训练二分类网络,用来判别语音识别系统的输入是否为语音信号,使用此方法,实现了噪声环境下的在线语音端点检测,为指令词语音信号在线采集提供了保障。然后,针对实际工程中可能存在非指令词语音信号的输入问题,语音识别系统需要拒绝非指令词语音输入,即开集识别问题。为了拒绝非指令词语音输入,本文在语音识别模型为CNN的基础上,采用了经典的阈值法和未知类法。但是由于深度学习模型具有非线性映射本质的限制,导致CNN中的特征向量到预测输出发生错误,以及未知类的不可预测性,导致阈值法和未知类法效果不好。为了解决开集识别问题,本文采用了特征向量法,使用CNN中的特征向量拟合每一个类的概率分布,用来拒绝非指令词语音输入,相较于阈值法的拒绝率得到大幅度提升,相较于未知类法的优势是不需要未知类别样本来训练模型。最后,针对噪声环境下智能挖掘机器人的在线指令词语音识别实验,介绍了实验的硬件组成及连接,实验中软件实现。实验包括非噪声环境下的指令词语音识别实验,噪声环境下的指令词语音识别实验,在这两组实验中都使用了HMM-GMM、LAS模型和CNN模型,通过比较和分析实验结果,给出了方法的评价。同样,给出了基于CNN训练出的二分类网络进行语音端点检测的实验及结果。关于开集识别的实验,分别进行了阈值法、未知类法、特征向量法这三种方法的实验,通过比较和分析实验结果,给出了方法的评价。
其他文献
项目式学习是一种广泛运用于教学领域的教学方式,在中小学项目式学习更是掀起了一股热潮。而教师将会以他被教的方式来教他以后的学生,因此在教师培训当中设置项目式教学可以让教师以学生的身份参与到其中,从中更了解学生的学习过程。而教师的自我效能感是其自主发展的重要内在机制,具备高效能感的教师能在其学习和工作中做出更多的努力,帮助学生成长的同时也实现自我的提升。本研究以参与第20期兴华创新实践师资班的科技准教
当智能汽车进入没有任何先验信息的未知环境时,汽车需要根据传感器实时获得周围环境信息以确定自己处在环境中的位置,并重建出周围环境的任务称为同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)。SLAM是实现智能汽车路径规划的前提,针对在地下车库场景GPS信号弱、定位不准确以及单独使用2D激光雷达点云信息匮乏而造成SLAM过程定位精度低、建图质量差
随着我国经济步入新常态,电量增长趋势渐缓,电网公司提升效益的难度加大,维持持续性稳健经营、完成预期的利润增长目标变得更加困难,从而对电网投资决策的要求就更高。电网投资决策和其发展水平密切相关,对电网发展水平进行诊断有助于发现其存在的薄弱环节,挖掘局部发展的内在驱动力,并提出针对性的诊断意见,为指导后续投资决策提供方向。电网投资优化是实现电网战略目标、确保电网安全经济运行的基础。随着电网数字化的不断
国际民商事交往日渐频繁,涉外民商事法律纠纷随之增加,司法作为解决涉外民商事纠纷的主要途径,在这其中承担着重要的职责。面对该种情况,一个国家涉外法律适用水平就显得十分重要,稍有不慎便会遭到其他国家当事人的不信任。中国也不可避免的存在该种情形,一方面在于中国与其他国家的实际情况不一样,其他国家民众不能很好的理解中国涉外民事关系法律适用的内涵,容易以其本国的标准来要求中国,当存在不一致时,就开始质疑中国
本文从区域发展的实际情况和科技人才政策对区域发展的影响出发,分析了科技人才政策和区域发展之间的相互关系,从区域两极化发展、科技人才效能受到影响、科技资源效能有待提升、科技信息存在安全隐患、区域经济发展不协调、人力资源聚集角度进一步探讨了区域科技人才分布不均衡的风险隐患,并针对当前存在的各类问题提出了针对性的对策建议。
西太平洋麦哲伦海山区是重要的铁锰结壳勘探合同区,具有极大的资源潜力。本文对麦哲伦海山区Kocebu海山的11个铁锰结壳表层样品(<1 mm)进行形态学、矿物学和地球化学研究,利用X射线衍射(XRD)、电感耦合等离子体发射光谱和质谱(ICP-AES/MS)等测试技术分析了结壳矿物组成、主微量元素和稀土元素含量,探讨其元素组成特征、生长速率特征、成因和物质来源,运用数学统计方法分析中西太平洋结壳生长的
慢病对人类健康构成重大威胁,我国慢病的形势也日益严峻。对于慢病的管理和治疗,人体的健康状态评估尤为重要。人体的生理信号如心率、呼吸、体温等蕴含了大量个体化的健康和疾病信息,同时,可穿戴设备的发展让人们可以低负荷、连续采集人体的生理信号,然而,人体是一个处于动态平衡的具有超高复杂度的系统,对实际生活中采集的连续生理信号进行分析很大的一个困难在于生理信号表现出高度个体化的特点。多元状态估计技术(Mul
自然保护区是自然资源和生态保护的重要区域,迄今为止,我国建立的自然保护区面积占国土陆域面积的18%。我国自然保护区不仅保护着珍稀濒危野生动植物,也保护着具有特殊意义的自然生态系统。自然保护区周边社区农户的生产生活对自然保护区内的自然资源有较强的依赖性,然而采用“抢救式”政策依法划定的自然保护区,在划建过程中未充分征求周边社区农户的意见,也未对周边农户的权益进行全面的考虑,在实行保护管理措施时不可避
中国是世界上最大的马铃薯生产国,约有七分之一的马铃薯用于淀粉及其延伸产品的生产。马铃薯淀粉的生产过程中会产生很多高营养、高附加值的副产物,但是这些副产物无法直接利用,就地排放会造成很大的环境污染。针对马铃薯淀粉加工副产物的资源化研究逐渐被重视起来,尤其是其在全面的回收和资源化后可做为食品、医药高价值商品。马铃薯淀粉工业副产物中含有丰富的营养物质,如:纤维素、果胶、蛋白质和游离氨基酸等,是出芽短梗霉
辐射源个体识别技术作为现代电子对抗中关键的一部分,为后续电子干扰和防御提供基础和支援,具有较强的军事应用价值。但是目前该技术的研究多从信号无意调制特征提取技术以及提高分类器的角度出发进行改进,未能将辐射源发射信号特征与辐射源硬件组成相联系,导致提取部分冗余特征影响个体识别精度。因此本文深入的研究辐射源信号无意调制特征产生机理,分析其与辐射源硬件结构的相关性,在此基础上利用相关性构建权重SVM,实验