混合双语语音识别的研究

来源 :声学学报 | 被引量 : 0次 | 上传用户:wb95879981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代社会信息的全球化,双语以及多语混合的语言现象日趋普遍,随之而产生的双语或多语语音识别也成为语音识别研究领域的热门课题。在双语混合语音识别中,主要面临的问题有两个:一是在保证双语识别率的前提下控制系统的复杂度;二是有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法,并将该方法与传统的基于声学似然度准则的聚类方法进行比较;针对双语语音中非母语语音识别性能较低的问题,提出一种新型的双语模型修正算法用于提高非母语语音的识别性能。实验结果表明,通过上述方法建立起来的中英双语语音识别系统在有效控制模型规模的同时,实现了同时对两种语言的识别,且在单语言语音和混合语言语音上的识别性能也能得到有效保证。 With the globalization of information in modern society, bilingual and multilingual mixed language phenomenon is becoming more common. The consequent bilingual or multilingual speech recognition has also become a hot topic in the field of speech recognition. In bilingual mixed speech recognition, the main problems faced by the two: First, to ensure that the bilingual recognition rate under the premise of the complexity of the control system; the second is to effectively handle the original language of the insert language caused by non-native accent phenomenon. In order to solve the problem of bilingual mixing and reduce the amount of data required for statistical modeling, a unified bilingual recognition system is established by phoneme hybrid clustering. In the clustering algorithm, a new two-pass phoneme clustering algorithm based on confusion matrix is ​​proposed, and the method is compared with the traditional clustering method based on acoustic likelihood criteria. For the non-native speech recognition in bilingual speech Low performance, a new bilingual model correction algorithm is proposed to improve the recognition performance of non-native speech. The experimental results show that the Chinese-English bilingual speech recognition system established by the above method can effectively control the size of the model and at the same time realize the recognition of the two languages ​​at the same time, and the recognition performance in single-language speech and mixed-language speech can also be obtained Effective guarantee.
其他文献
阅读《世界科幻博览》,总给人一种视野开阔的感觉,尤其是作为每期主打的“雨果奖”和“星云奖”历年获奖作品。面对它们,你会发现你苦思冥想了许多年的科幻构思,原来早就被那些前辈作家们轻松地思考和创作过了。只不过这些作品都带有一定的时代烙印,掺杂着明显的神话和童话色彩,比如古堡和幽灵什么的,而波尔·安德森又对这些格外垂青。  《悲剧之歌》深刻地反映出在电脑管理社会的时代,个性化人类的极端痛楚,对于系统与个
(2002年1月18日实施)美国地质调查局(USGS)负有向政府其他机构和公众提供地震信息的责任。有关地震的信息以多种方式,包括以对有感地震响应的方式为联邦政府、州政府和地方政府以及民间团体提供服务。公众能够快速得到他们能够理解的、准确的地震大小信息,有助于他们采取适当的反应。由于地震与公众安全密切相关,所以美国地质调查局制订了关于快速发布准确的、一致的、公众能够理解的关于地震大小的管理规定,所有
期刊
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7
期刊
【摘要】天然气在城市生活中扮演着重要角色,其管道设计是建筑工程设计的重要组成部分。本文根据作者多年的相关工作经验,首先对城市燃气管道设计常见问题进行了较为系统的分析,然后提出了城市燃气管道优化设计策略,以资天然气管道设计的相关问题研究。  【关键词】天然气运输 管道设计 常见问题 优化设计  城市燃气管道为城市输送着城市生活所必需的天然气,可以说其的存在关系着城市的生存和发展,但是燃气管道的存在面
本文除介绍常用的说话人识别技术外,主要论述了一种基于长时时频特征的说话人识别方法,对输入的语音首先进行VAD处理,得到干净的语音后,对其提取基本时频特征。在每一语音单
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7
随着信息技术的飞速发展,多媒体技术已经日益成熟,并广泛应用于社会建设的方方面面,多媒体教学已经成为目前教育领域十分普遍和科学的教学手段。尤其是近年来高校规模不断扩大,对
期刊
每个人都得有个理想才能活下去吧?  贾苏的理想是造出一部机器。  泡泡的理想是革命。  梅樱的理想是从良。    二十世纪二十年代,在上海,终日可以听到周璇、白光①的歌声,甜腻的、低沉性感的声音在空气中化开,销魂蚀骨。在这样的空气中生活的人,像喝了酒一样,带着微醺的醉意,送走一个个丧权辱国的日子。  ——写到这里,我仿佛已经听到了愤怒的抗议,二十世纪二十年代的上海是个多么革命的地方啊!纸醉金迷,十
建立了壳内地震、板间地震、板内地震的峰值地动速度(PGV)和峰值地动位移(PGD)的长周期(5~30s)地震动预测方程(GMPE)。使用了剪切波速大于或等于2 000m/s的层间的KiK-net井下台网台站强地震动数据。这些数据由日本及其周边的20次6≤MW≤9.1的地震构成,包括2011年的日本东北地震。在推导长周期地震动预测方程时运用了两阶段回归分析。尽管附加了诸如震源深度和地震类型这些尽量能
期刊