基于GMM-UBM的稳健说话人识别系统

来源 :第九届全国人机语言通讯学术会议 | 被引量 : 0次 | 上传用户:liongliong526
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了一种基于MFCC倒谱特征和GMM-UBM模型的稳健说话人识别系统,旨在基于当前主流技术的基础上进一步改进系统识别率和噪声鲁棒性,因此本文仅对低层次的声学特征进行提取和建模,并对系统的前端处理进行了如下改进:提出基于子带能量和基频检测的语音检测算法;使用CMVN特征归一化方法提高MFCC倒谱特征的抗噪声干扰性能;证明了对数能量特征在说话人识别系统中的无效性;探讨了SDC动态特征在说话人识别系统中的应用。在 NIST的说话人验证评估集上进行了测试,改进后的系统的错误率比基线系统降低了约26%。
其他文献
本文构建了一个普通话对话语气韵律模型。在构建该对话语气韵律模型的过程中,本文借鉴了现有陈述语气韵律模型的研究成果,同时针对对话语气所独有的特点对其进行了扩展。与陈述
会议
穴1雪毛发大量脱落是西蒙-席汉氏综合征或精神分裂症病情加重的信号。穴2雪眼睑下垂是重症肌无力、糖尿病、颅内动脉瘤、脑干病变、先天性眼睑下垂的信号。穴3雪眼皮浮肿是肾
医院的固定资产是医院经营的物质基础。本文通过对目前医院固定资产的管理中存在的诸多问题,提出了解决问题的办法与对策,这对加强医院固定资产管理具有非常重要的意义。 Th
本研究基于大规模中介语语音数据的统计和分析,提出了四项具体的参考指标来评价中介语的声调系统:调类的区分性系数和独立性系数、调值的稳定性系数和正确性系数,并给出了每项指
在布鲁塞尔参加国际记者合作委员会会之后,我抽出半天时间参观了世界博览会,看了苏联、捷克斯洛伐克、匈牙利和法国等几个展览馆,其中最吸人注意的是苏联展览馆.它的规模宏
本文针对采用支持向量机的说话人确认中,提出采用相对背景模型的权重更新量以及均值更新量形成超向量,用这个超向量作为支持向量机的特征函数,在线性核函数的情况下,能够取得优于
旅游文本是一种以呼唤功能为主兼具信息功能的特殊文本,旨在促进不同国家间的语言转换和文化交流。因此,翻译旅游文本时应尤其注意语言文化差异。本文以西藏佛教景点英译为例
汉语是声调语言,相同的音节带上不同的声调所代表的语义就很不相同。对于学习普通话的人来说,掌握正确的声调发音至关重要,而对于计算机辅助语言学习或普通话水平测试系统来说,准
会议
为了加快粒子群优化算法的收敛速度,增强全局的搜索能力,通过对粒子群优化算法中惯性权重和全局最优值的分析,提出了一种根据迭代次数而自适应变化的惯性权重的粒子群优化方法。
会议
目的观察藤莓汤对胶原诱导性关节炎(collagen-induced arthritis,CIA)大鼠滑膜过氧化物酶体增殖物激活受体-γ(peroxisome proliferator activated receptor gamma,PPARγ)、