半监督判别分析的跨库语音情感识别

来源 :声学学报 | 被引量 : 0次 | 上传用户：cr15mo3

【摘要】

：

针对训练样本与测试样本来自不同语音情感数据库造成特征向量空间分布不匹配的问题,采用半监督判别分析减小二者的差异。首先寻找有标签的训练样本和来自另一个库的部分无标

【作者】

：

金赟宋鹏郑文明赵力

【机构】

：

江苏师范大学物理与电子工程学院,东南大学水声信号处理教育部重点实验室,东南大学儿童发展与学习科学教育部重点实验室,

【出处】

：

声学学报

【发表日期】

：

2015年01期

【关键词】

：

语音情感识别判别分析训练样本投影方向测试样本 Berlin 散度样本间分类器特征向量

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对训练样本与测试样本来自不同语音情感数据库造成特征向量空间分布不匹配的问题,采用半监督判别分析减小二者的差异。首先寻找有标签的训练样本和来自另一个库的部分无标签训练样本之间的最优投影方向。基于一致性假设即相近的点更有可能具有相同的类别,利用p近邻图对无标签训练样本相近点之间的关系进行建模,从而获得无标签样本的分布信息。在保证无标签样本间流形结构的同时,使所有训练样本类间散度和类内散度的比值达到最大,从而得到最优的投影方向。采用两组实验进行验证,第1组用eNTERFACE库训练去测试Berlin库,识别率为51.41%,第2组用Berlin库训练测试eNTERFACE库,识别率为45.76%,相比未采用半监督判别分析的识别结果分别有了13.72%和22.81%的提高,说明该算法的有效性。通过实验前后数据的可视化分析,说明利用半监督判别分析确实减小了不同库之间特征向量空间分布的不匹配问题,从而提高跨库语音情感识别率。 Aiming at the mismatch of spatial distribution of feature vectors caused by different speech emotion databases from training samples and test samples, semi-supervised discriminant analysis is adopted to reduce the difference between the two. First, look for the optimal projection direction between a labeled training sample and a partially unlabeled training sample from another library. Based on the consistency hypothesis that similar points are more likely to have the same category, the p-nearest neighbor graph is used to model the relationship between similar points in unlabeled training samples to obtain unlabeled sample distribution information. While ensuring the manifold structure between the unlabeled samples, the ratio of the divergences and the divergences of all kinds of training samples is maximized so as to obtain the optimal projection direction. Two groups of experiments were used to verify that in the first group, Berlin library was tested by eNTERFACE library, the recognition rate was 51.41%. In the second group, the eNTERFACE library was trained and trained with Berlin library, the recognition rate was 45.76%. Compared with the semi-supervised discriminant analysis The recognition results have been improved by 13.72% and 22.81% respectively, which shows the effectiveness of the algorithm. Through the visual analysis of the data before and after the experiment, it shows that the semi-supervised discriminant analysis does reduce the problem of mismatch of the spatial distribution of eigenvectors among different databases, so as to improve the emotion recognition rate of cross-bank speech.

其他文献

高校计算机教学中学生创新能力的培养分析

在高校的计算机教育中,学生主体性的学习能力、创新能力以及综合实践能力备受重视,为充分发挥学生在高校的计算机教学中的重要能力,高校教师正在朝着实际教学最大化程度地改

期刊

计算机教学高校创新能力培养

介绍小麦优良品种高倍繁殖的做法

呼盟是内蒙古自治区的小麦主要产区,每年所需的种籽量很多.而小麦的繁殖倍数又很低,一般只是播种量的10倍左右.因此,新培育出的优良品种或是提纯复壮了的品种,不可能尽快地

期刊

小麦优良品种播种量提纯复壮播量合理追肥稀植农业技术措施单粒单位面积落粒

基于泛雅平台的线上线下混合式教学模式实践探索r——以《电工基础》课程为例

基于泛雅学习与培训平台,开展电工基础课程的线上与线下混合式教学实践探索.电工基础课程具有较强的理论与实践融合特点,与生活实际息息相关,借助泛雅平台可实现线上教学与线

期刊

泛雅平台混合教学电工基础实践研究

三维动漫制作与虚拟现实的融合探讨

在现代专业技术中,3D动漫制作技术具有重要地位。现阶段,为了提高3D动漫制作质量,通常会融合其他技术,其中VR技术应用较为广泛。对此,本文探讨了3D动画技术和VR技术关系探讨,并提出两种技术融合方法。

期刊

三维动漫虚拟现实技术融合分析

“课程思政”背景下《python编程基础》课程教学改革研究

实现思想政治教育与技术技能培养的有效融合,已成为高职院校人才培养与教学改革的重要任务.《python编程基础》课程作为一门专业必修课程,是软件技术专业学生的专业教育入门

期刊

课程思政python教学改革课程

水稻启闭式旱育苗秧田管理技术指标

塑料薄膜保温全旱育苗(旱做床,旱管理)是我省稻区近年来开始采用的一种新的育苗方法。可分为常规窄床旱育苗和启闭式宽床旱育苗。常规窄床旱育苗播幅1米,床长10米,净播种面

期刊

旱育苗秧田管理北方稻区壮秧育苗方法叶龄难于控制出叶作物群体播种量

互联网背景下高职体育教学模式创新与实现

近年来,人们对高职教育方面的关注力度逐渐加大,高职院校学生们的体育教学模式受到了人们的广泛关注,作为对学生身体素质发展有着重要联系的一门课程,需要高职院校的教师进行

期刊

互联网高职体育教学创新与实现

高职计算机动漫专业VR教学机制研究

随着我国教育改革的不断深入,对高职院校计算机动漫专业提出了更高的要求,计算机动漫专业作为计算机教育的重要学科之一,高职院校有必要在信息时代的背景之下,寻求科学合理的

期刊

计算机动漫专业VR教学高职院校教学机制

裴氏软肝消痞丸对小鼠移植性肝癌H22瘤组织中P27及Bcl-2蛋白表达的影响

目的：通过观察裴氏软肝消痞丸（PRGXP）对小鼠移植性肝癌H22瘤组织中P27、Bcl-2表达的影响，探讨裴氏软肝消痞丸对荷瘤小鼠免疫系统的调节、抑制肿瘤的作用，分析其治疗原发性肝癌的作

学位

移植性肝癌裴氏软肝消痞丸Bcl-2蛋白肿瘤组织P27基因

浙江电视台强化管理成效显著

长期以来浙江电视台十分重视各项管理工作,自1993年底起又先后推出一系列新的管理措施,并在某些方面有所突破。为了加强宣传管理,该台制订了《磁带管理条例》;实行节目监制

期刊

浙江电视台管理成效宣传管理电视设备广播电视管理条例宣传口径核定编制责权利相结合设备利用率

半监督判别分析的跨库语音情感识别

与本文相关的学术论文