双子空间迁移学习方法的跨库语音情感识别

来源 :苏州大学 | 被引量 : 1次 | 上传用户:yupeng198652
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的快速发展,语音作为人类传达情感的重要方式之一,占据着越来越重要的位置。传统的语音情感识别技术都基于一个共同的假设:训练数据和测试数据都来源于同一个数据库,即训练集和测试集具有同样的特征空间分布。然而,由于不同语料库的情感获取方法、情感种类以及录音环境有所不同,此时训练集和测试集存在分布差异,从而导致基于同分布假设的传统语音情感识别方法不能够很好地解决跨库识别问题。而迁移学习的引入己被证明可以显著减少不同域之间特征分布的差异性,因此,本文提出了双子空间迁移学习框架(Dual-Subspace Transfer Learning,DSTL)以提高跨语料库的情感识别性能。针对特征映射迁移学习方法忽略特有信息的缺陷,本文工作提出了融合共性与特性的双子空间迁移学习框架,对仅利用共性的特征映射迁移学习进行改进,以提高情感识别性能。本文具体研究内容如下:(1)为进行跨库语音情感识别的性能比较,本文工作建立了汉语情感语音数据库(Mandarin Emotional Speech Dataset Portrayed,MES-P)。该数据库是由说话人根据离散情感标签录制完成,随后由标注者通过听觉感知及主观判断将每个语音样本的情感定量转化到效价度/唤醒度(Valence/Arousal,VA)空间。因此,该数据库不仅为本文的跨库语音情感识别研究提供了重要的数据基础,还可用于离散情感到维度空间转换的后续研究。(2)研究了全局与局部分布差异约束作为正则项的特征映射迁移学习方法。本文工作将基于类间距离和类内距离特征分组的改进主成分分析方法作为基础方法,利用全局相关的最大均值差异和局部相关的图嵌入方法分别作为正则项对其进行分布差异约束,得到三种不同的特征映射迁移学习方法。实验结果表明,与传统机器学习方法相比,特征映射迁移学习方法的召回率提升了 8.11%。并且全局与局部分布差异算法在平衡库与不平衡库方案下展现出不同的识别性能。(3)针对主流特征映射迁移学习方法仅利用共性,而忽略特性的缺陷,提出融合共性与特性的双子空间迁移学习框架,双子空间指的是:a)公共子空间:利用特征映射迁移学习方法学习公共子空间,在该子空间中通过减少源域和目标域的分布差异以保留域之间的共有信息;b)特性子空间:针对特征映射迁移学习方法未利用特有信息的不足之处,提出了目标化源域特有信息(Source-specific Mapping to Target subspace,SMT)方法,能够在特性子空间中保留源域和目标域的特有信息。因此,该双子空间框架通过引入特有信息,能够对仅利用共性的特征映射迁移学习方法进行改进。结果表明,双子空间迁移学习方法的平均召回率较其基线方法得到3.05%的提升,并且召回率高达61.67%。
其他文献
优良的Aβ显像剂必须对Aβ斑块有较高的亲和性,而体外竞争结合实验是筛选Aβ斑块显像剂的有效方法,实验中需要使用放射性配基[125I]TZDM。以对溴苯胺为起始原料,经过四步反应
"互联网+"背景下网络营销已成为现代中小企业引领市场竞争不可或缺的渠道之一。在此环境下,倘若企业不能有效解决渠道冲突,则将无法获得可持续发展的机会。文章在剖析企业营
作为直接参与过中国革命、建设和改革历史进程的党和国家领导人,邓小平关于民族团结的独到认识和见解,是中国共产党民族团结思想和理论的重要组成部分。在不同历史时期,邓小
元杂剧作为中国古典文学的重要组成部分,在中国戏剧史上它的出现既标志着我国戏曲已经发展为成熟的艺术形式,又代表着古典戏曲史上的第一高峰,同时元代也是我国古典悲剧的高峰。“悲剧”作为一美学范畴、文学体裁在中国一直备受关注,中国悲剧的团圆结局问题历来备受国内外学者的热议。本文以元杂剧这一艺术类型为主,以团圆结局的悲剧为研究对象,论述团圆结局作为悲剧的组成部分之一并不是判别剧作是否为悲剧的决定性因素,团圆
全国人大教科文卫委员会副主任委员吴恒说:“义务教育的短板在农村,农村义务教育的短板在教师队伍。”同样义务教育阶段的新课程改革在农村教师的适应性问题上也最为突出。本文运用问卷调查法、个别访谈法、参与式观察法、文献研究法等方法对资源县农村教师在新课程改革的适应性问题上进行探讨。从十所学校的调研中收集到相关数据和资料,对其整理过程中探讨从导言、农村教师个案调查点的概述、农村教师在新课程改革适应性中存在的
随着护理模式的转变 ,护理工作职能的拓展 ,在护理工作中 ,一切影响病人康复的因素、工作人员自身健康因素、医院感染危害因素等都将成为护理工作中的风险因素。各级护理管理
<正>昭王末年,荀子人秦,和时任秦相的应侯范睢就秦国政风民情有过一段精彩的对话。《荀子·强国》篇记其事云: “应侯问孙(荀)卿子曰:‘入秦何见?’孙卿子曰: ‘其固塞险,形
会议
RACK1蛋白编码基因最早在动物中发现,后来在许多真核生物中都发现了动物RACK1基因的同源基因。哺乳动物RACK1是一种支架蛋白,并可以与许多信号分子相互作用调节不同的信号转
剑麻渣是剑麻纤维工业中产生的副产物,主要由纤维素、半纤维素、木质素和果胶共同组成,拥有丰富的可发酵糖。开展剑麻渣综合利用,对实现生物质资源高值化利用与减少环境污染具有积极意义。由于剑麻木质纤维自身结构的特殊性阻碍了可发酵糖的酶解转化,需要采取有效的方法对其进行预处理。本文提出一种基于紫外光催化过氧化氢氧化预处理(UV photocatalysis and hydrogen peroxide pre
广信府便利的交通和理学的传播,都给宗族的形成和发展提供了条件。在清初“三藩之乱”的影响和政府积极召垦政策的推动下,福建移民成为近代广信府宗族的主要来源。因受到太平军、中共领导的革命力量以及日本侵略军三大外部力量的冲击,广信府宗族呈现出曲折的发展态势。为了维持内部稳定,近代广信府宗族建立了以族长为核心的层级式管理组织;在国法和礼法的双重制约下订立了较为全面的族规家法;修建祠堂为开展各类宗族活动提供场