混淆网络相关论文
随着互联网和信息技术的快速发展,多媒体信息资源越来越多,对多媒体信息进行检索和分类也越来越重要。广播、会议、互联网上的语音数......
基于大词汇量连续语音识别(LVCSR)的语音检索是音频信息检索的重要研究方向。本论文针对该方向的三个重要技术问题进行研究:第一,从......
目前,基于统计的方法在机器翻译领域内占据着主导地位,出现了多种不同类型的基于统计方法的机器翻译系统,如基于短语的系统、基于层次......
近年来,统计机器翻译技术得到了快速的发展,许多基于不同范式的统计翻译模型被相继提出,如基于短语的统计翻译模型、基于句法的统计翻......
随着经济全球化的不断发展,跨语言交流的需求不断增长,使用机器翻译实现自然语言的自动翻译有很大的需求。近年来机器翻译技术不断进......
随着网络和计算机技术的发展,网络上语音信息的数据量急剧增加,与此同时,对于这些语音信息的管理和应用就提出了新的要求,因此语音......
近年来,统计机器翻译取得了很大的发展。基于短语的翻译模型和层次短语翻译模型被广泛用于机器翻译评测和在线翻译系统中,成为统计机......
随着大数据时代的到来,各种音频、视频文件日益增多,如何高效地定位关键敏感信息具有非常重要的研究意义.目前研究人员对针对英语......
蒙古文属于黏着语,词根和后缀能够组合成近百万的蒙古文单词。现有的蒙古语大词汇量连续语音识别(LVCSR)系统的发音词典无法包含所有......
随着大数据时代的到来,各种音频、视频文件日益增多,如何高效地定位关键敏感信息具有非常重要的研究意义.目前研究人员对针对英语......
蒙古语语音识别系统的词表很难覆盖所有的蒙古文单词,并且随着社会的发展,蒙古文的新词和外来词也越来越多.为了解决蒙古语语音关......
为了提高蒙古语语音关键词检测任务中的集内词检测性能,该文结合蒙古文的构词特点提出了基于词干进行检测的蒙古语语音关键词检测......
给出了一个基于音节混淆网络的语音文档内容检索系统,提出了一种基于两阶段解码的查询自动扩展方法,首先通过Viterbi解码算法在混......
最近混淆网络在融合多个机器翻译结果中展示很好的性能.然而为了克服在不同的翻译系统中不同的词序,假设对齐在混淆网络的构建上仍......
在汉语大词汇量连续语音识别中,以往基于最大后验概率准则解码得到的识别结果具有最小的句子错误率,为了得到字错误率最小的识别结......
为了提高语音查询项检索效率,提出了一种在加权有限状态转换器(Weighted finite-state transducer,WFST)框架下以混淆网络代替词格建......
将触发式语言模型应用于混淆网络解码过程来提高汉字识别率。为了利用词间的长距离依赖信息,提出了基于词义类对触发式语言模型的......
解码器是连续语音识别系统中最能直观反映系统性能的重要组成部分。解码技术的研究目的就是要优化解码过程,使解码器能够在得到较......
多机器翻译系统融合技术能够对不同机器翻译系统的输出结果有效地进行融合产生更好的翻译性能,因此该技术成为机器翻译研究领域的一......
为了高效地从大词汇量连续语音识别(LVCSR)的多候选中得到关键词结果,保证最小词错误率,提出了将混淆网络的思想应用到关键词检出系统......
为快速生成高质量混淆网络,该文提出一种最大后验弧主导的快速生成算法。它只需遍历一遍Lattice,具有线性时间复杂度。采用K-L散度......
通过语音与机器进行自由交流是人们多年以来的梦想。经过几十年的不懈努力,语音识别技术已获得了巨大进步,但仍难以满足实际应用的......
随着互联网和多媒体技术的快速发展,每天都会涌现海量的音频文件,如何对这些语音文档进行有效地检索和分类成为信息处理领域中的一......
近几年随着计算机多媒体技术的快速发展,蒙古语的教育、影视、文化等诸多方面的语音资料越来越多,已形成了丰富的民族文化资源。如......
关键词识别是语音识别的一个重要研究领域,具有广阔的应用空间与巨大的应用价值。本文对关键词识别技术的发展现状与主要技术进行......
在普通话大词汇量连续语音识别中,使用最大后验概率决策规则解码得到的是具有最小句子错误率的识别结果,但是本文通常使用字错误率作......
期刊