【摘 要】
:
电话作为使用最为普遍的远程语音通信设备,在我们的日常生活中扮演着重要的角色,同时也为我们的生活带来了极大的便利。近些年,随着人工智能相关技术的迅速发展,原本需要大量人力来完成的诸多重复性劳动,比如电话客服所从事的工作,开始受到一定的冲击。在这一次的技术浪潮中,语音识别(Automatic Speech Recognition,ASR)技术起到了至关重要的作用。然而,在电话场景下的语音识别技术也面临
论文部分内容阅读
电话作为使用最为普遍的远程语音通信设备,在我们的日常生活中扮演着重要的角色,同时也为我们的生活带来了极大的便利。近些年,随着人工智能相关技术的迅速发展,原本需要大量人力来完成的诸多重复性劳动,比如电话客服所从事的工作,开始受到一定的冲击。在这一次的技术浪潮中,语音识别(Automatic Speech Recognition,ASR)技术起到了至关重要的作用。然而,在电话场景下的语音识别技术也面临着巨大的挑战。因为,面向电话场景的语音识别任务更倾向于自然口语对话,语音的内容更贴近人们的日常说话习惯,这也就导致了个体性的差异。人们的说话内容及其广泛、风格迥异,而如何在有限训练数据的前提下,进一步提高电话场景下语音识别的效果,是仍需解决的问题。本文将围绕电话场景下的语音识别解码器展开研究,主要工作以及创新点如下:首先,本文在语音识别解码器中整合了语音活动检测模块。本次实验中采用了基于延时机制并加入统计信息的深度神经网络(Deep Neural Network,DNN)模型。实验结果表明,本文的语音活动检测模块可以很好地适应电话场景的语音活动检测工作,以较低的功耗和检测错误率很好地取代了基于DNN的语音活动检测方式,在测试集上的检测错误率相对下降了约42.4%。其次,本文探究了词图生成的相关技术。现有解码器中的词图生成算法主要依赖于在语音结束时生成相应的确定化词图,而当待解码的有效语音过长时,词图的确定化(Determinization)工作会产生较高的延迟甚至可能导致严重的内存泄漏。因此,本文考虑在实际解码过程中采取新的词图生成方式:也就是取消词图确定化工作。通过这种方式,最终使得解码的平均延迟减少达到25%,并且保持识别准确率不变。最后,本文研究了神经网络语言模型,并将其应用在语音识别的词图重估过程中。本文尝试对循环神经网络(Recurrent Neural Network,RNN)的结构做出一定调整,从而使得RNNLM更适合运用在电话场景的语音识别任务中。由实验结果可知,改进后的RNNLM能够很好的应用于电话场景下的词图重估任务中,在测试集上的平均字错误率相对下降达到3.2%。
其他文献
时空插值是空间插值的拓展,是分析数据时空分布特征的重要基础。基于数学模型的传统时空插值方法受到模型结构限制,参数选择易受主观因素影响,难以拟合时空距离与时空权重的复杂非线性关系。为此,本文构建了时空自回归神经网络插值方法,利用神经网络拟合时空权重,提升了时空插值精度。本文主要研究内容如下:(1)针对传统时空插值方法存在的模型选择与参数估计受主观影响、难以拟合时空距离与时空权重的复杂非线性关系等问题
随着我国城市地下综合管廊建设进入高速发展时期,搭建一个更具智慧化的运维平台成为当前综合管廊运维管理工作的迫切需求。建筑信息模型(Building Information Model,BIM)作为近年来在建筑领域广泛关注和研究的新兴技术,在建筑运维阶段具备显著的应用价值,因此开发集成BIM应用的综合管廊运维平台成为热门方向。本研究基于此背景,针对以下两个问题开展深入探究与实践,问题一:BIM的应用能
当今,手机已经成为了人们日常工作以及生活中的不可或缺的物品,而且人们对手机的使用已经不仅仅限于通讯工具,手机中搭载的第三方应用程序(Application,以下简称APP)已经成为人们移动办公、商务交流、学习、休闲娱乐的得力助手,手机中各个APP与用户的关系已经到了密不可分的地步。为了满足广大用户对于手机APP使用提出的高要求,在短时间内研发出一款受用户喜欢并且拥有高质量、高性能的手机APP成为了
遥感作为对地全方位观测的技术手段,能够有效辅助野外地质调查工作。随着遥感技术的进步,遥感影像的空间分辨率和光谱分辨率得到很大提升,基于高分辨率遥感影像的地质信息提取和解译研究受到广泛关注。然而,由于自然地物的复杂性,野外地质体的精细解译多通过人工目视解译完成,消耗大量人力的同时效率不高,遥感地质智能解译方法亟待发展。本文使用Worldview-2高分辨率立体像对和Sentinel-2多光谱卫星影像
大数据技术经过多年发展,已经在工程建设和管理的各个领域得到广泛应用。大数据技术为工程项目管理带来新的发展方向,可以大幅提升项目管理的效率,为项目决策提供有益的参考,并最终实现项目目标和提高经济效益。雪亮工程是构建立体化治安防控体系的基础性工程,也是维护社会稳定的民生工程,但是雪亮工程在各地不同程度的存在视频资源整合、视频大数据智能化应用、智能运维保障等方面的工程管理问题,这些问题一定程度影响了雪亮
智能制造工程是中国智能制造2025的五大工程之一。机器视觉作为一个基础数据收集和图像处理技术,已经成为了智能制造密不可分的一部分。然而在目前国内机器视觉行业中,大多数是针对机器视觉算法处理的研究,而针对机器视觉实际应用的研究少之又少。随着项目的进度管理的理念逐步深入人心,对机器视觉项目进行进度管理迫在眉睫,因为它可以对项目时间、成本、质量进行监控,并提高项目成功率。本文以HC公司的机器视觉项目为研
高校教学管理系统作为高校教学管理工作中的基础保障,与每位在校学生和教职工息息相关。高校教学管理系统作为所有高校中最基础、每天大量师生需要使用的信息系统,经历20余年发展迭代,本应与高校的教学管理模式充分磨合,成为提升高校教学管理质量和效率的工具。但在使用过程中,往往可以看到系统所提供的功能与实际工作要求不一致、简单的管理过程复杂化等反而增加了教学管理人员及师生工作量的情况。绝大多数高校和师生将此类
大洋科考对于人类研究海洋,探索生命起源、地球演变以及开发海洋资源有着重要的意义,世界投入了巨资对其展开了大量的研究工作。大洋科考数据是大洋科考第一手重要的成果,通过对大洋科考数据的深入研究,为人类开发、保护、利用海洋提供决策依据。因此,对大洋科考数据进行科学的、有效的管理是一项极其重要的工作。海洋是一个庞大复杂的巨系统,大洋科考必须从多角度利用多种科考技术、科考手段和科考设备对海洋进行考察。同时,
本文总结整理了网络上对于两体一维完全弹性碰撞总碰撞次数和圆周率关系的相关讨论和证明,分别以几何方法和代数方法给出了清晰的说明。文中对一维完全弹性碰问题也进行了推广:对于两个物体初速度都不为零的情况,以几何图形法对这个问题给予了阐述;对于三体碰撞的情况我们猜测到了一个漂亮的解析公式,并以数值计算的办法对这个猜想给予了验证,但是没有给出严格的解析证明;当考虑碰撞过程的相对论修正之后,总碰撞次数就与物体