基于综合因素的汉语连续语音库语料自动选取

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:lkhyuse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大词汇量连续语音识别系统的性能很大程度上取决于语音库的质量,而语音库设计的中心环节就是语料选取.但是传统语料选取方法往往考虑因素单一,不利于语音识别系统有效利用语言信息.本语音库的语料选取方法综合考虑了多种因素:三音子覆盖率、三音子覆盖效率、三音子稀疏度、常用词分布等,并完全实现程序自动选取,充分利用了原始语料,使选取结果的信息量更加丰富.程序自动选取结果可以覆盖94.1%的三音子,75.4%的最常用词,覆盖效率和稀疏度也比传统方法有了较大改善.
其他文献
已故的历届苏联领导人中,斯大林之死最耐人寻味。斯大林生前手中握有至高无上的权力。迟暮之年,斯大林的多疑已发展到了离奇的地步。临终前不久,更出现了躁狂性恐惧症。用餐时,某一道菜只要没有人当面亲自品尝,他是决不去动的。那些多年来侍奉左右、忠心耿耿的人,他一个也信不过。连医生,斯大林也不信任。他多年不让专家看病,仅在前往海滨休假时偶尔准许派一名他了解的牙医去。因此,谁也不了解斯大林的真正健康状况。195
期刊
在互联网和数字化浪潮的冲击下,全球各地许多实体书店纷纷关门停业。当许多人不再看好实体书店的前景时,世界上不少“最美书店”却没有因为网络书店和电子书的冲击走向末路,而是成为城市中独特的风景线。    中国:老书虫书吧  位于北京三里屯南街的“老书虫书吧”,获得多家媒体“用一家书店赞美一座城”的赞誉。三间总面积数百平方米,挑高至少8米以上的宽敞房间明亮通透,1.5万本藏书从地面摆列到需要用梯子才可以够
作用效应句是作用句的一个特殊子类,是HNC57组基本句类中一个极富个性的重要句类.从HNC概念网络的角度看,作用效应句主要由使役类动词和逼迫类动词直接形成,或者由一般作用类
本文介绍的工作是在汉语句法分析研究基础上的一种应用研究,对术语如何下定义问题进行了理论上的探讨.术语的定义形式在汉语语法结构方面提供了模板结构和构成方式,可以作为
党的十七大后特别是近年来,我国在50多个国家举办了200多个中国文化节、艺术节,展现了我国丰富多彩的文化艺术和时代精神,加强了同这些国家的文化交流,为树立中国文明、民主、开放、进步的形象、增进友谊,发挥了积极作用。  海外“欢乐春节”  文化部在海外开展春节文化活动已经10多年,积累了宝贵的经验,近年来已经形成中国文化交流的品牌项目。2010年,首次以“欢乐春节,和谐世界”作为主题,联合多部门从全
期刊