基于查询扩展的中文语音高效检索

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户：passkakaxi

【摘要】

：

中文语音检索系统用于快速准确地在中文语音文档中定位用户查询.典型实现方案对语音文档进行识别后建立索引,对查询串进行分词并以分词结果检索.检索过程中出现的查询分词与

【作者】

：

李伟吴及吕萍

【机构】

：

清华大学电子工程系,

【出处】

：

模式识别与人工智能

【发表日期】

：

2011年04期

【关键词】

：

中文语音检索分词查询扩展有穷自动机基于令牌的搜索

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

中文语音检索系统用于快速准确地在中文语音文档中定位用户查询.典型实现方案对语音文档进行识别后建立索引,对查询串进行分词并以分词结果检索.检索过程中出现的查询分词与识别结果不匹配将影响系统性能.为解决该问题,产生多种查询分词结果,并对其进行前后缀扩展后检索.为解决因扩展带来的检索内容过多,用时较长的问题,引入有穷自动机压缩扩展,在此基础上设计基于令牌的搜索算法高效检索.实验证明,对查询的多分词与前后缀扩展可以使检索EER相对提升50%～70%,引入FSA可压缩检索空间,使得检索速度提升近30倍. Chinese speech retrieval system is used to locate user query quickly and accurately in Chinese speech documents.A typical implementation scheme is to identify speech documents and index them, to segment the query strings and to retrieve the word segmentation results. Query segmentation and recognition in the retrieval process In order to solve this problem, a variety of query segmentation results are generated, and the prefixes and suffixes are extended to retrieve them. In order to solve the problem of excessively long retrieval time due to the excessive retrieval content, Based on which the search algorithm based on tokens is efficiently searched.The experiment proves that the multi-word query and the prefix-suffix expansion can make the retrieval EER relative increase 50% ~ 70%, and introduce FSA compressible search space , Making retrieval speed nearly 30 times.

其他文献

让“热”情释放，让身心栖息的好地方——鸡公山

鸡公山给人的印象是灿烂的，一如最温暖的色彩，可以任你为一草一树、一人一歌去畅想，让你的心绪得到最美的释放；可以在炎炎夏日中逃离闷热的城市，在这里尽情享受清凉舒心的痛快。这

期刊

鸡公山栖息温暖闷热

宁安市污水处理厂一体化工艺应用的探讨

通过一体化A/O改良工艺应用,分析其去除COD效果.

期刊

污水处理厂一体化工艺应用探讨

基于标识支持区分QoS的PPS调度机制

在对现有并行分组交换(PPS)分析的基础上,将标识的概念引入交换结构,提出了一种基于标识支持区分服务质量(QoS)的PPS调度机制.该机制以业务类为单位管理网络数据流,采用按序

期刊

标识基于联合输入交叉节点排队的并行交换区分服务质量信元按序发送调度算法

饮料中柠檬黄含量测定的不确定度分析

对饮料中的柠檬黄含量进行了测定和不确定度分析,通过对各影响因素的不确定度评定,试验重复性对饮料中合成着色剂的测量结果不确定度的影响最大,其次是样品处理回收率和标准

期刊

饮料柠檬黄不确定度

中国水利水电第十一工程局有限公司

中国水利水电第十一工程局有限公司(以下简称公司)是世界500强企业——中国电力建设集团旗下中国水利水电建设股份有限公司的全资子企业,具有国家水利水电工程施工总承包特级

期刊

水利水电建设工程局中国水利水电工程施工总承包

太极扣冠外附着体在后牙游离缺失修复中的应用研究

目的探讨太极扣冠外附着体(ERA)在后牙游离缺失修复中的临床应用效果。方法随机选择22例后牙游离缺失患者,采用自身前后对照设计,在使用ERA义齿修复前先佩戴钢丝卡环胶托活动

期刊

太极扣冠外附着体后牙游离缺失easy resilient attachmentposterior teehextension defect

大学生错（牙合）畸形与口腔健康相关生存质量的相关性

目的：调查错(牙合)畸形与大学生口腔健康相关生存质量（OHRQoL）的相关性。方法从秦皇岛地区4所高校随机抽取610名无正畸史、缺失牙和颌面部畸形的大学生为研究对象。选用正畸治疗

期刊

异甘草酸镁预防奥沙利铂肝损伤的临床观察

目的：观察异甘草酸镁预防奥沙利铂致肝损伤的疗效。方法对照组采用奥沙利铂、亚叶酸钙、氟尿嘧啶方案化疗，治疗组采用奥沙利铂、亚叶酸钙、氟尿嘧啶方案化疗同时使用异甘草酸镁

期刊

奥沙利铂异甘草酸镁肝损伤oxalic acid platinummagnesium isoglycyrrhizinate injectionliver

基于最优邻域的动态加权混沌风速预测模型

提出了短期风速的混沌预测方法。首先利用关联积分法确定滞时和嵌入维数，重构风速时间序列的相空间。在此基础上，采用基于最优邻域的动态加权混沌预测模型进行风速预测。该模型

期刊

风速预测混沌关联积分最优邻域

直流入地电流经交流电网分流计算模型的简化及算法分析

直流入地电流经交流电网分流的计算过程复杂,涉及到大范围地质分层结构.旨在简化计算模型,指出直流地电位分布与直流地电流分流的关系.首先分析了土层结构的Hummel法简化及其

期刊

直流入地电流分流直流地电位分布土层结构Hummel法等效电阻贝塞尔函数

基于查询扩展的中文语音高效检索

其他学术论文