【摘 要】
:
在煤炭装船过程中,为避免堆积,需要及时调整大铲(煤炭输出口)的位置。当前采用的工作方式是:观察员甲站在甲板上负责观察船舱底部煤炭堆积情况,并提前将情况通过步话机传递给操作员乙,乙在控制室做出响应,再调整大铲位置。这种方式存在的缺陷有:(1)甲乙配合工作不协调,可能导致方位调整不准确、不及时;(2)浪费企业人力资源。针对以上问题,本文设计了专门的小词汇量语音识别系统来替代乙的工作。甲将调整指令发送到
论文部分内容阅读
在煤炭装船过程中,为避免堆积,需要及时调整大铲(煤炭输出口)的位置。当前采用的工作方式是:观察员甲站在甲板上负责观察船舱底部煤炭堆积情况,并提前将情况通过步话机传递给操作员乙,乙在控制室做出响应,再调整大铲位置。这种方式存在的缺陷有:(1)甲乙配合工作不协调,可能导致方位调整不准确、不及时;(2)浪费企业人力资源。针对以上问题,本文设计了专门的小词汇量语音识别系统来替代乙的工作。甲将调整指令发送到控制室后,系统能够及时识别出该指令并指挥大铲移动,其中核心的工作是准确识别出甲所使用的语音指令。本文参考连续语音识别方法,研究了小词汇量语音识别的理论、方法和应用,解决了该问题,主要工作概括如下:(1)搭建了双向长短时记忆(Bidirectional Long Short Term Memory,BLSTM)网络模型。依据BLSTM在处理时序类数据方面的优势,搭建了含全连接层和BLSTM层的五层深度学习网络。(2)采集了专门的语音指令语料库并做预处理。在本课题的应用背景下,系统并不需要识别大规模的连续语音,而是高频率地使用少量指定的专用词汇、短语、固定搭配等语音。因此本文对数据进行了分类采集,包括基础类、关键词类和含关键词句篇类,以对应模型的不同训练阶段。预处理提取了语音的梅尔倒谱系数,将语音数据转化为了特征矩阵的形式。(3)优化了训练和预测方法。优化训练过程:与自定义数据集相对应,模型训练分为三个阶段,即基础模型阶段、关键词训练阶段和最终模型阶段;优化预测过程:比较了基于贪心算法与基于束搜索算法的时序分类函数的预测过程;实验表明,贪心算法耗时少于束搜索算法,但准确率略低于束搜索算法。综合考虑,本文选择了束搜索算法。通过以上各阶段的对比和优化,在本文的实验环境下,模型特定人使用准确率达到98%,非特定人使用准确率达到94%,能够满足应用需求。(4)设计了图形用户接口(Graphical user interface,GUI)程序以实现模型实时调用和识别。采用图形作为GUI前端,模拟煤炭出口;采用训练好的模型作为GUI后台,进行运算和识别。本程序能够实时地采集用户语音,控制图形执行相应的操作。通过这种方式,本文直观地展示了应用场景和模型用法。另外,为了便于应用程序进一步开发和拓展,本文给出了自定义模型和自定义语料库的方法和注意事项,提高了模型的可移植性。
其他文献
自导电聚合物被发现以来,有机半导体材料在近40年得到了迅猛发展,其中窄带隙半导体材料具有吸收在红外区域、迁移率高和激子束缚能低等特点,其在有机场效应晶体管,有机太阳电
在1980年,Neumaier首次提出了t(1/2)-设计的概念,并且对t≥ 2的t(1/2)-设计进行了完全的分类.因此,对于t(1/2)-设计的研究就可以转化为对于1(1/2)-设计的研究,随后,许多数学
太阳日冕的活动使我们可以在行星际太阳风中的日球层电流片(HCS)和其伴生的日球层等离子体片(HPS)的附近观测到一些结构和波动。在文献调研之后我们发现HCS和HPS附近的磁流体
东濮凹陷具有构造复杂、断块破碎、储层薄、变化快、油藏高度小等地质特征,目前的勘探开发中主要存在着以下几个问题:复杂断块成像效果差,小段块圈闭把握不准、信噪比和分辨
近年来,人们对红曲米的潜在的利用价值越来越感兴趣,大量的研究表明红曲米中Monacolin K的含量相对较低,却具有改善动物高脂血症的功能。推测红曲米中可能有一些改善血脂的活
煤层注水技术对于降低粉尘浓度、防火和降温、井下预防冲击地压、预防煤与瓦斯突出等方面具有重要作用,可有效改善工作面生产环境。自2014年7月,高家堡矿建设施工以来,大巷开挖过程中出现了多次冲击地压动力显现现象。具体表现为底板迅速鼓起,两帮突然鼓出,肩窝及顶板出现下沉,锚杆(索)出现断裂现象,同时伴随有响亮的煤炮声,冲击地压灾害形式十分严峻;同时开采坚硬煤层中还产生大量粉尘,开采时大量的吸入粉尘颗粒,
一直以来,吲哚酮化合物因其独特的生物活性被广泛应用于天然产物和生物医药的合成中,同时吲哚酮化合物自身的合成也受到广泛的关注。目前,吲哚酮化合物的合成主要集中在后过
沉浸式视频是一种可以使用户自由探索全方位视角,与视频内容交互并产生真实沉浸感的新型媒体。近年来,沉浸式视频得到了飞速的发展。沉浸式视频在现有网络上传输时面临巨大的带宽消耗和严格的时延要求。传输完整的沉浸式视频比传输普通2D视频要多付出超过300倍的带宽资源,为避免用户产生强烈的晕眩感需要使时延低于20ms。这个传输要求超过了现有网络可以支持的能力。例如,LTE系统在20MHz带宽的下行峰值速率为1
目前,市场上的墙体保温材料主要分有机和无机两大类,有机保温材料由于燃烧性能不能达到A级不燃水平而必须退出外墙保温市场。与传统保温材料相比,发泡水泥保温材料不但高强质
令Fq为q元有限域,q是一个素数幂.Fqn为Fq上的n维行向量空间.令Wl为Fq上n维仿射空间AG(n,Fq)中不过原点的l-flat的集合.用Hi∈Wr标记行,用Pj∈Ws标记列,构造矩阵H(r,s,n,q)=(c