【摘 要】
:
非母语口音是语音识别系统实现广泛应用所必须面对的主要问题之一,而口音识别是实现口音自适应,提高非母语口音语音识别性能的主要组成部分。本文提出了一种基于支持向量机的民
论文部分内容阅读
非母语口音是语音识别系统实现广泛应用所必须面对的主要问题之一,而口音识别是实现口音自适应,提高非母语口音语音识别性能的主要组成部分。本文提出了一种基于支持向量机的民族语口音识别方案。本文基于母语分别为傣语、傈僳语、纳西语和汉语普通话的发音人所发汉语普通话语句,采用对每个语句样本提取12维MFCC参数、9维基频派生参数和9维短时平均能量派生参数等作为口音识别分类器的输入特征参数集,选用高斯径向基函数作为支持向量机的核函数,利用8层交叉验证法进行民族语口音的分类及识别测试,实验结果表明,男、女声的平均口音识别率均超过93%,取得了预期的实验结果。
在此基础上,论文进一步探讨:
(1)通过对不同类型的特征参数集进行识别对比,尝试寻求在保证一定的民族语口音正确识别率且计算代价较小前提下的最佳特征参数集组合,不但使男、女声的口音识别率均超过93%,而且男、女声的口音识别率之间仅相差0.42%。
(2)通过对实验原理及结果的分析,总结出利用支持向量机进行民族语口音识别的优势和不足,为后续研究提供帮助及借鉴。
(3)对语音样本的选择、特征参数的选择与提取、实验方法的设计等方面做出详细地探讨,并提出了一些原则及方法。
其他文献
绿脓杆菌是临床上常见的机会性革兰阴性致病杆菌,常感染烧伤病人、癌症患者等免疫力低下的人群,由于绿脓杆菌只对非常有限的数种抗生素敏感,对其感染的治疗常很困难,由该菌引起的
摘要:健康快乐活着的人,常常会忘记警惕那些潜在的危险,所追逐的东西,常常是那些无关生死的身外之物,会以为明天无限长而肆意地消费今天。殊不知,明天和意外,哪个先来,没有人能够进行预测,经历过生死的边缘,才能懂得生命的意义,才会去珍惜活着的每一天。 关键词:时间;生命;珍惜 小时候,在电视上看到一些人因为海啸、地震……而失去生命的时候,我总是觉得不能理解,失去生命到底是一种什么样的感觉呢,为什么电
本实验以抗旱性不同的三种裸燕麦为材料(草莜一号、燕莜、2032),采用0.0 kV/cm、1.0kV/cm、2.0 kV/cm、3.0 kV/cm、4.0 kV/cm、5.0 kv/cm六个场强,分别处理三个品种的裸燕麦种子10 mi
摘要:随着中学英语新课改春风的沐浴,中学英语课堂出现了新气象,老师的教学理念得到更新了,也采用了新的教学模式,特别在英语教学中师生角色发生了根本性转换,开始践行英语课改,打破传统英语老师独霸课堂的局面,英语老师在英语教学中重新定位,扮演新角色:老师原来由单纯的传授者,逐渐转变为学生兴趣的激发者,学生情感的依托者,教学设计的策划者,教学活动的组织者,课堂活动的参与者,自主探究和合作研讨的诱导者,使整
多目标决策是现代决策科学的重要分支,自从诞生以来就一直是学术界关注的研究课题,在经济、管理、工程和军事等诸多领域都有着广泛的应用。近年来,不确定多目标决策引起了学
以太网技术经过二十年的发展,以其简便实用、价格低廉的特性,几乎统治了局域网,并用事实证明它是承载IP数据包的最佳载体。随着IP业务在城域和干线传输中所占的比例不断攀升,以太
本课题来源于北京遥感设备研究所的某科研项目。主要工作是在特定工程应用背景下开展直波接收机的研究工作,在此基础上,根据导引头对直波接收机的技术要求,建立直波接收机的数学
正交频分复用(OFDM)是第四代移动通信的核心技术,它的优点是具有很好的抗多径衰落的能力,并且提高了频谱的利用率。但是,OFDM系统对频偏和相位噪声非常敏感,频偏会破坏子载波
CDMA通信系统性能主要被多径和多址干扰所影响,因此需要提高扩频序列的相关特性来削减干扰,来满足系统对用户量的需求。扩频技术的关键问题也就是论文的主要研究内容:如何设计兼
构建cDNA文库是寻找生物新功能基因的有效手段.采用SM ART技术构建了重金属铜和镉暴露铜锈环棱螺全组织均一化cDNA文库,文库库容为1.78×106克隆,重组率大于99%.从初始文库中