基于音节片Lattice的语音检索关键问题研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户：s5067744

【摘要】

：

随着互联网和信息技术的快速发展，多媒体信息资源越来越多，对多媒体信息进行检索和分类也越来越重要。广播、会议、互联网上的语音数据越来越多，如何在海量的语音库当中搜索出我

【作者】

：

陈国兴

【机构】

：

哈尔滨工程大学

【出处】

：

哈尔滨工程大学

【发表日期】

：

2012年期

【关键词】

：

语音检索音节Lattice 混淆网络词片

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网和信息技术的快速发展，多媒体信息资源越来越多，对多媒体信息进行检索和分类也越来越重要。广播、会议、互联网上的语音数据越来越多，如何在海量的语音库当中搜索出我们需要的信息，成为亟待解决的问题。所谓语音文档检索是指，根据用户输入的查询请求，在语音资源中搜索和返回与查询请求中关键词相关联的语音段或语音文件的处理过程。语音文档检索一般包含两个阶段：离线索引阶段和在线检索阶段。离线索引阶段主要包括语音识别和索引构建两大模块。在线检索的性能和这两个模块息息相关。语音识别结果有三种形式，One-best、N-best和Lattice形式。Lattice是一种有向无环图形式，包含的候选结果多，可以补偿语音识别错误带来的影响，有效地提高系统的检索性能。因此目前研究人员多采用Lattice作为语音识别的结果，基于Lattice的语音检索也成为主流。在汉语语音识别中，和汉字、词和短语句子相比，音节因为其数量有限，表达内容丰富而成为基元，更重要的是音节可以有效地解决词表外词(OOV)的问题。在基于音节Lattice的语音文档检索中，Lattice冗余信息多，结构复杂，不便于处理，本文研究了在Lattice基础上生成混淆网络的方法。混淆网络是一种更为简洁高效的网络，接近线性结构，包含的信息丰富并且易于后续处理。和Lattice相比，基于混淆网络构建的索引占用空间更小，更适合后续检索。同时为了提高检索的精度，本文基于文本分析的结果，筛选出词频较高的一些音节组合作为词片，生成音节和音节词片的语言模型，再生成字词混合的Lattice，将其转化为混淆网络，实验证明这种方法有效的提高了识别率。传统的向量空间模型(VSM)应用于多候选结果的语音文档检索时存在不合理性，本文针对传统的VSM模型进行了改进，改变了权重计算方法，使之更适合基于多候选的混淆网络检索。实验表明，词片的引入大大提高了Lattice和混淆网络的识别率，同时混淆网络的索引形式相比Lattice更为简洁高效、易于处理。同基线系统的检索结果相比，基于混淆网络的语音文档检索精度在准确率和结果排名方面都有大幅提升。

其他文献

MB-OFDM UWB系统半盲信道估计算法研究

超宽带信道的描述方法主要有S-V室内信道模型和IEEE802.1.5.3a室内信道模型。由于IEEE802.15.3a室内信道模型较为复杂，在计算机仿真实验中不便于实现。针对这一点，超宽带频率域

学位

超宽带信道自回归信道模型子空间分解信道估计修正矩阵

基于视频监控系统运动目标检测跟踪算法的研究与实现

目标检测和跟踪，是从一系列的图像序列中检测出运动的目标，并且给出运动目标在图像中的位置。在视频监控、智能交通、军事等领域，目标检测和跟踪技术都得到了广泛的应用，是进行相

学位

视频监控系统运动目标检测跟踪算法背景差分法卡尔曼滤波

基于s3c2440的嵌人式视频监控系统的设计与实现

自从人类进入21世纪以来，计算机通信技术、网络通信技术、多媒体通信技术对人们的学习、工作、生活产生了广泛而深远的影响。人们对于安全的需求也在不断的增强，在人流量较大的

学位

视频监控图像传输多媒体通信网络架构

声纳图像信息隐藏算法研究

因为世界各国海军的发展和海洋民间开发，海洋水下通信的应用也越来越广泛，在军事方面在不安全信道下的通信安全一直都很重要。比如在敌人或靠近敌人范围内活动的蛙人与己方的安

学位

隐蔽通信声纳图像k-LSBs能量调制扩频信息隐藏

无线多媒体传感器网络多约束QoS路由机制研究

近年来，多媒体传感器技术的快速发展，用户对无线传感器网络具有多媒体功能的需求日益迫切，无线多媒体传感器网络应运而生。多媒体数据能够提供更加丰富的监测区域信息，但是同样对

学位

QoS路由机制无线多媒体传感器网络蚁群算法遗传算法

下一代无线通信址接入技术OFDMA和SC-FDMA的性能分析

正交频分多址(OFDMA)和单载波频分多址(SC-FDMA)是第四代移动通信(4G)的两种主要的多址接入方案。OFDMA是一种无线多址接入技术,主要基于正交频分复用(OFDM)技术。然而,OFDMA

学位

正交频分多址单载波频分多址基本容量界上行链路传输多输入多输出技术链路预算

基于时间反转聚焦的水声无源材料声学性能测量

水下声学材料构件是水声工程中使用广泛且至关重要的水下部件,不同的应用背景对材料声学性能有特殊的要求。随着材料科学的进步,粘弹性高分子材料等高性能吸声新材料在吸声降噪等水声工程领域的应用日益广泛。因而,对该类材料在水声使用环境中的声学性能测量和研究是迫切需要解决的问题。水声无源材料的声学性能测量包括插入损失(透射系数)、回声降低(反射系数)、吸声系数等参数的测量。目前水声无源材料的声学性能测量在中高

学位

时间反转无源材料透射系数反射系数

信息物理系统中基于Delaunay三角剖分的数据传输

信息物理系统(Cyber-physical system，CPS)是一个在环境感知的基础上，深度融合了计算、通信和控制能力的可控、可信、可扩展的网络化物理设备系统，CPS的一项基本应用就是采集数

学位

信息物理系统Delaunay三角剖分数据传输路由查找节点部署算法

超高速无线局域网频谱感知实验平台设计与实现

本学位论文的研究课题来源于国家科技重大专项“新一代宽带无线移动通信网”之“超高速无线局域网无线接口关键技术研究与验证”课题(No.2010ZX03005-001-01)。该课题致力于

学位

超高速无线局域网频谱感知能量检测自相关峰OFDM识别

毫米波探测器的信号分析与处理器设计

本论文分析了自差式8毫米波段探测器的回波信号和系统噪声特征,仿真并设计了信号处理电路,采用快速傅立叶变换(FFT)算法进行去噪。着重研究了系统的低噪声设计,对FFT去噪算法

学位

8毫米波段自差机低噪声设计信噪比差分方法过采样FFTFPGAVerilog编程

基于音节片Lattice的语音检索关键问题研究

其他学术论文