基于高斯混合模型的文本无关说话人年龄识别

来源 :苏州大学 | 被引量 : 0次 | 上传用户:birchwoods2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式识别是一种人工智能技术的应用。其基本思想是在计算机中构建一个人类智能的模型,然后利用已有的信息(数据)对其进行训练,即优化其内部参数,使得它按照一定的准则逼近“真实的”情况。本文所做的工作是在语音识别领域应用模式识别技术,从而达到估计说话人年龄段的目的。在基于说话人的语音特点进行系统训练时,首先提取语音信号的梅尔频率倒谱系数(MFCC,Mel-Frequency Cepstrum Coefficients)作为特征参数,然后采用高斯混合模型(GMM,Gaussian Mixture Model)对不同年龄语音进行建模,同时应用通用背景模型(UBM,Universal Background Model)与GMM相结合以提高识别率并减少训练识别时间。系统测试识别时,采用与训练阶段相同的MFCC特征参数,通过比较测试样本相对于各个模型的后验概率得到最终的识别结果。实验结果表明利用这几种技术的组合,我们可以凭借很少的训练样本实现一定精度的识别率。为将来进一步研究提供依据。本课题的研究内容主要包括以下几个方面:1.说话人的语音特征分析,包括语音的能量特点,频率特点,MFCC等。2.应用高斯混合模型GMM对各个年龄段的语音数据进行建模并训练,分析识别结果。3.应用通用背景模型GMM-UBM进行建模并训练,分析识别结果。4.对训练数据和测试数据进行各种分割组合,分析不同的训练集对测试结果的影响。
其他文献
近日,“中国·龙泉青瓷艺术展”在德国柏林举行,来自浙江龙泉的精美青瓷艺术品让德国观众赞不绝口。龙泉青瓷在世界舞台的惊艳亮相已不是第一次。2007年12月,沉睡800年的南宋古
报纸
江汉油田建设年代早,受当时客观条件限制,居住小区整体布局分散、设施水平较落后,难以满足当前人们物质文化水平不断提高的需要。按照设施综合治理、打造"美丽幸福油田"的建设
基于西北农村学校规划与用能的现状问题,从绿色设计理念视角分析当代教育对校园总体规划的新要求,提出安全健康与应急避难系统、交流沟通与互动空间系统、节能减排与生态循环
语音信号中包含着许多信息,例如语音的内容、语音的语种、说话人的性别和身份信息等。说话人识别技术是将语音信号中表明说话人身份的特征提取出来,再利用这些特征来辨别说话
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
本文首先介绍了以"交互界面与交互空间"为标志的新型界面技术产生的现实背景,然后探讨了"交互界面与交互空间"的起源、分类及相对于传统界面的优势。在此基础上,文章进一步论
21世纪初我国正处在一个转折点上,如何维护社会政治稳定,尽量避免出现局部性的动荡问题,是摆在我们面前一个十分严峻的任务。这几年由于多种原因造成的不稳定因素而引发的群体事