汉语语音听写机技术的研究与实现

来源 :软件学报 | 被引量 : 35次 | 上传用户:tsks1848
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章从声学基元和词法树两个方面对连续语音识别和汉语语音听写机中声学层面的搜索策略进行了分析,提出了基于统计知识的帧同步搜索算法和基于词法约束的词搜索树结构,构成了声学层面的双层搜索网络.算法中利用了统计知识,包括声学层面的差分状态驻留信息和特征变化量信息等.实验结果表明,基于知识的搜索策略使连续语音识别的性能提高了36.6%.文章还介绍了N-Gram统计语言模型的修正退化频度估计算法和搜索算法原理.通过对多年研究成果的分析,实现了一个汉语语音听写机的引擎,并在PC机上构建了两个系统:非特定人汉语语音
其他文献
目的:了解广东省沙门菌等几种重要食源性致病的耐药状况及耐药谱.方法:参照CLSI推荐的琼脂扩散法.结果:受试的72株沙门菌和6株O157:H7大肠杆菌中,分别只有1株对14种抗生素全
维生素E作为天然抗氧化剂在牛肉中主要发挥护色作用、延缓脂肪氧化及保水作用.α-生育酚是防止高铁肌红蛋白形成的最有效形式之一,其通过延缓脂肪氧化而间接发挥护色作用.
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
本文报道采用0.0750ppm小瓜虫没1号治愈金鱼、鲤鱼小瓜虫病新方法,施药后48h在鱼体未找到活体 小瓜虫。小瓜虫没1号对金鱼的安全浓度为0.0999ppm。 This article reports th
近来计算机和通信技术的发展使得视频点播(video-on-demand,简称VOD)在技术和经济上成为可能.连续媒体的特性使得VOD系统需要大规模的存储服务器.层次化存储体系是减少系统费用的合理方案.文章提出了一种
文章综述了20世纪90年代以来多Agent系统中Agent思维状态模型的研究结果.从直观分析、形式化模型、结构模型、合作研究和应用方面来介绍Bratman的哲学观点、Cohen和Levesque的意图模型、Rao和Georgef的BDI模型等重要成果,最后介
期刊
随着大规模网络的建设和应用,网络管理问题变得越来越重要.由于传统的集中式的网络管理模式已越来越难以胜任这项工作,人们及时地提出了分布式网络管理的概念.该文论述了一个基于
期刊