面向车载导航的语音交互技术

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:niwai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近代计算机技术的飞速发展,语音识别技术日趋成熟,尤其是孤立词语音识别技术取得了较高的识别准确率,然而随着语音识别技术限制条件的放宽及实际应用环境的限制,仍存在一系列亟待解决的问题,对于大词汇表的连续语音识别技术,在识别速度、准确率、系统顽健性等性能上还远远没有达到尽善尽美。  本文以车载导航系统为应用背景,从语音识别应用的角度出发,结合语音合成技术建立一个语音交互的系统。实现中,重点研究以下几个技术问题:  (1)采用了隐马尔可夫模型建模,着重比较不同的声学建模方法对于识别结果的影响,如隐马尔可夫模型的结构,识别基元选择(音节、声韵母)等。  (2)通过对文本语料的训练,构建语言模型,实现音字转换的过程。通过结合声学模型和语言模型完成大词汇量连续语音识别系统,并通过参数调整提高系统的各方面性能。  (3)系统实际应用环境噪声的存在,严重影响了语音识别的准确性。实验中,借助语音增强技术对语音进行降噪处理,比较不同的语音增强算法的降噪效果以及对语音识别的准确率的影响。  (4)语音交互过程的设计与实现。系统主要是针对深圳市地名集合,采用了分区查询策略,建立语音交互过程。  本文通过系统的实现与实验结果发现,利用隐马尔可夫建模,相对于音节、声韵母建模,基于上下文相关的声韵母建模识别效果取得较好的识别效果,增加隐马尔可夫模型结构状态数一定程度上提高了识别准确率。在严重的车载环境噪声情况下,借助语音增强技术识别率达到50%,较噪声环境下提高了近24%。语音识别与语音合成技术结合可以建立良好的语音交互模式,提高用户使用的方便性与快捷性。
其他文献
在动态变化的无线传感器网络(WSN)环境中,如何在有效利用传感器节点受限资源的同时获得较好的应用性能是WSN研究的关键问题之一。基于Q学习的传感器节点任务调度算法是解决这
随着计算机与网络通讯技术的迅速发展,网络环境日益复杂、攻击手段日新月异,入侵检测作为网络安全的第二道防线,能有效地保障网络安全,已成为当前网络安全领域的研究热门。现
随着Web技术和企业信息化的迅猛发展,越来越多的企业正在采用面向服务架构(Service-Oriented Architecture,SOA)将企业中已有的信息系统整合起来,实现系统间的信息共享、协同
安全多方计算是近年来国际密码学界的一个热点研究问题,主要研究如何保证合作计算环境中互不信任的参与方能够获得各自所需要的正确信息,同时在合作计算的整个过程中又不会向其
传感器已被广泛的应用于工业、医疗、军事等方面。由传感器节点构成的无线网络也已经成为当今研究的热门问题。由于目前无线传感器网络节点的能源、带宽和计算能力都非常的有
学位
随着信息化系统在企业中不断普及,Web服务的发展已经成为企业中实现资源共享的一种推动力,然而Web服务作为资源在异构系统之间共享很容易导致Web服务安全受到威胁。访问控制技
随着大数据时代的来临,各领域产生的信息呈现出几何式爆炸增长的趋势,其中有些高速的海量数据需要被实时处理。在这种背景下,流处理系统应运而生。大部分流处理系统采用的是连续
人类对自身之美的研究已经有几千年的历史了,人类对美的不断追求,促进了人的审美意识不断提高,同时也促进了社会的发展,而面部美学又是其中的研究重点。古今中外对于人脸美学的研
随着计算机和网络技术的高速发展,以并发性、分布性和实时性为主要特征的并发与分布式系统已成为计算机的主流研究方向。从C.A. Petri提出Petri网以来,各种从不同侧面反映并
BGP协议是目前Internet上唯一应用的域间路由协议,其任务是依据特定的路由策略,维护那些构成 Internet的自治系统之间的可达性。但是当前对 BGP协议的应用已经远远超出其最初的