朝鲜语语种辨识方法研究

被引量 : 0次 | 上传用户:oyfj2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语种辨识是语音识别的一个重要研究方向。目前,大多数语音识别系统都是针对单个语种训练的,因此,如果面向未知语种或多语种语音,现有语音识别策略将会失去有效性。随着科学技术的高速发展,对多民族语种信息查询和民族语口语翻译等系统的需求越来越迫切,而在这些系统中对特定范围的民族语语种辨识技术的研究与应用显得尤为重要。但是,在语种辨识研究过程中存在着单一语种语音识别所不具有的困难与挑战,它涉及到在多语种语音空间中分析不同语种的差异性音频特征的问题,因此,在朝鲜语、汉语和英语等多语种框架下研究朝鲜语语种辨识问题与单语种语音识别具有同样重要的学术价值和实际意义。本学位论文基于朝鲜语特定音节和韵律特征提出了在多语种语音数据空间中辨识朝鲜语语音对象的方法。首先,根据朝鲜语语法形态特点,针对实际的朝鲜语文本文档内容统计分析得到在朝鲜语文档中经常出现的助词或词尾(语尾),并根据朝鲜语语音变化规则统计得出在朝鲜语语流中常出现的助词或词尾(语尾)的实际发音,将出现频率较高的前8个助词或词尾(语尾)的实际发音音节作为特定音节。采用时间规整网络结构算法规整特定音节的MFCC和LPCC特征,并利用维数统一的特征训练人工神经网络分类器,将该分类器作为特定音节基分类器。其次,提取基音频率、声音强度、共振峰、能量和发音速率等5种音频特征,并计算前4种特征对应的均值、变化范围、最大值、最小值和方差等统计量:选用基音频率和共振峰的统计量作为一组特征,声音强度、能量的统计量和发音速率作为另一组特征分别训练支持向量机基分类器SVMFF和SVM IER。最后,通过组合音节分类器、SVM_FF基分类器和SVM IER基分类器,采取少数服从多数的原则决策一个音频文件的语种是否为朝鲜语。实验结果表明,在朝鲜语、汉语和英语等3个语种构成的语音数据空间中,本文提出的基于特定音节和韵律特征的朝鲜语辨识方法获得了87.25%的识别率,有效地解决了多语种环境中朝鲜语语音检测问题,验证了本学位论文所提方法的合理性与有效性。
其他文献
外泌体(exosome)是生理或病理环境中相邻或远距离细胞之间信号通讯的关键媒介。间充质干细胞(mesenchymal stem cells,MSCs)和恶性肿瘤B细胞产生的外泌体在B细胞恶性肿瘤微环
以乙二醛为原料,经肟化合成了乙二肟、后经氯化合成了二氯乙二肟、后经叠氮化-环合反应合成1,1’-二羟基-5,5’-联四唑二水合物、最后经过中和反应合成了1,1’-二羟基-5,5’-
随着中国电视产业的发展,女性电视节目以其关注现代女性生活状态,讨论女性群体所关心的各种问题,展现新时期的女性形象,成为电视节目的后起之秀。本文在梳理女性电视节目发展
一则成功的广告,离不开恰当的广告策略和广告思维方式。掌握并能熟练运用各种广告策略与思维方式,是一个广告人必备的素质。
教育技术领域如果接受"工具理性"的统治,后果将是灾难性的。"工具理性"带给人们的是肤浅和盲从。技术与目的具有内在逻辑关系,"目的理性"应该得到张扬。教育技术不仅仅是工具
英语和朝鲜语中都具有词层面上的数量表达方式,本文称之为量化词。当量化词与否定词共现于一个句子中时,量化词的存在会影响句中否定词的否定辖域。本文在句法、语义两个层面
翻译是从语言到语言的转化过程和结果,其中存在着不可避免的文化差异的处理,从而达到双方文化的互相理解和沟通。文化意识就是这些差异的代表之一,并能充分展现出本国文化的独特
针对移动终端的硬件和无线网络的特点,对其网页优化设计研究,总结出几个原则和方法。首先,分析常用移动终端的特点,以及用户的使用需求,总结移动终端网页设计的优化原则。然后,提出
舒曼是十九世纪上半叶最具代表性和最具特点的浪漫主义音乐家之一,他在德国乃至整个欧洲音乐文化史上都占有重要地位,是德国浪漫主义音乐的典型代表。《a小调钢琴协奏曲》是
会展旅游发展起步晚、发展快,成为带动经济发展的新亮点。但是会展旅游业的发展也存在诸如缺少专业技术及人才、重展轻会、市场运作机制不完善等问题。本文分析了我国会展旅