基于音素层信息的语种识别

被引量 : 0次 | 上传用户:bobo1116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动语种识别,作为智能语音处理的一个重要方向,是指利用计算机自动地识别一段语音所属语言种类的过程。随着全球化进程的加速,全球各个国家和地区人们之间的交往变得越来越频繁,突破语言障碍变得极为迫切;因此,语种识别在多语种语音识别前端、信息检索、军事情报收集、公共安全等领域的应用价值逐渐体现,受到了相关应用领域的广泛关注。根据使用的特征不同,可以将主流的语种识别方法分为两大类:基于声学特征信息的语种识别方法和基于音素层信息的语种识别方法。其中,基于音素层信息的语种识别方法首先利用音素识别器将一段语音识别为一段音素序列,然后利用不同语种间的音素搭配存在差异这一特点进行语种识别。基于音素层信息的语种识别方法以其性能优异稳定、推广性好等优点受到越来越多研究人员的重视。本文对基于音素层信息的语种识别方法进行了较为系统的研究,搭建了从音素识别器到语种分类模型的语种识别系统,并在提高语种识别系统性能、降低算法复杂度等方面取得了一定的进展。具体的研究工作包括以下几个方面:第一,针对音素识别器的训练语料挑选问题,提出了基于音素平衡准则的数据选择方法,从大量语音数据中挑选出适量数据,提高了语种识别性能。第二,对一段特定语音,音素识别的结果及其搭配关系会受到说话人、信道等因素干扰而引入不必要的噪声。针对于此,提出采用因子分析方法去除噪声:首先在词图输出的序列基础上建立基于bagofN‐Grams的向量表示形式,然后在此向量空间中,采用因子分析方法估计说话人、信道等非语种因素差异所产生的噪声子空间并加以消除,显著提高了语种识别性能。第三,在PR‐SVM系统中,针对特征矢量高维、稀疏带来的计算和存储问题,提出了一种特征选择方法,通过对表征语音段的低阶特征矢量进行区分性选择,将具有较高区分度的低阶特征上升到高阶特征,将特征维数控制在可接受的范围内,提高了特征的区分性,进一步改善了语种识别系统的性能。
其他文献
无线网络的容量和可靠性是网络设计的两个关注重点。如何在有限的无线资源的条件下,提高网络容量和保障网络可靠性的成为无线网络的研究重点。无线Mesh网络是高互联度的网络
随着新课程标准的实施和课程改革的进一步深化,对学生阅读能力的培养已逐渐受到广大教师的重视。在我国,阅读课教学是初中英语课教学的核心,读前活动是英语阅读课的第一步。
混凝土结构常因耐久性不足而达不到设计使用寿命。水和氯离子等侵蚀性物质是混凝土发生劣化的必要条件。在侵蚀性环境中,防水处理是推迟混凝土结构修复时间,提高其耐久性的一
我国历史文化名城众多,而历史街区作为有历史遗存的文化片区,是历史文化名城的重要组成部分。人们对历史街区遗存的认知及保护由来已久,妥善处理有价值的历史遗存是具有挑战
规划环境影响评价法律制度作为我国环境保护领域的重要法律制度之一,在预防和控制环境污染与生态方面发挥了巨大的作用,规划环境影响评价制度着眼于环境问题的全局性和根本性
教师话语是课堂教学中最重要的一个组成部分,对其进行实证研究非常重要。本研究将对6位优秀初中英语教师课堂话语的互动特征进行全面系统的分析和统计。研究者选取了6位初中
随着我国城市化进程的加快,非农建设占用耕地逐年增多,失地农民的数量在不断扩大。由于我国的政策和体制不健全,失地农民往往处于城市的边缘,不能享受和城市市民一样的待遇,他们的
随着城市越江隧道工程的规划和建设,在市区各种不同类型的地面建筑物、地下构筑物、桩基、桥基及地下管线等错综复杂地密集分布的客观情况下,往往由于受既有建筑物、施工技术
将RFID用于医疗废物物流管理,可以彻底改变过去落后的靠手工登记的交接方式,避免交接过程产生二次污染,同时提高医疗废物在收集、运输、储存和处置环节中的信息化水平。具体
背景:心肌梗死(MI)严重威胁着人类的健康。近十余年,基质干细胞(MSCs)疗法为治疗MI带来了新的希望。MSCs可以起到改善病理性心室重塑,增强心脏功能,促进疾病恢复的治疗作用。