【摘 要】
:
随着计算机在各个领域的广泛应用,语音识别作为人机交互的关键技术越来越受到人们的重视。为了更全面的反映说话人的信息,听视觉多模态语音识别逐渐成为研究的热点。语音情感
论文部分内容阅读
随着计算机在各个领域的广泛应用,语音识别作为人机交互的关键技术越来越受到人们的重视。为了更全面的反映说话人的信息,听视觉多模态语音识别逐渐成为研究的热点。语音情感识别是多模态识别的一种,它让计算机在识别语音内容的同时又能判别说话人的情感状态。本文以基于矢量量化(VQ)算法的孤立词识别系统和基于主成分分析(PCA)算法的图像识别系统为基础,构建听视觉情感语音识别系统。孤立词识别系统包括声学层识别和语法层修正两部分。为了改善声学层识别系统的不足,本文研究了一种适用于孤立词识别、基于词汇、短句统计的2元语法规则。该语法模型由词语矩阵和短句矩阵两大部分组成,按照相应的规则对原始识别结果加以修正。测试实验表明,识别率在语法规则的帮助下有了较为明显的改善。本文从摄像设备录制的连续视频流中抓取特定时刻的人脸表情图像,经过预处理和主成分分析,与表情模板库中的样本比较,进而判别图像所属的情感类别。为了在时间轴上实现语音识别和图像识别结果的同步对应,首先在语音信号端点检测时,利用语音段之间的时间的差异产生标点符号,以标点符号的产生时刻作为图像识别程序从视频中抓取图像的时间点。再利用标点符号和图像的对应关系,把语音识别的输出结果和图像识别的输出结果进行融合,最终产生带有情感标记的语音识别结果。实验测试表明,这种综合识别系统能在识别语音内容的同时反映说话人的情感状况。
其他文献
本文主要研究在预设航标环境中,通过航标识别和跟踪,实现移动机器人的自主定位和导航。本文着重讨论了三个方面:全方位视觉的标定与校正、目标识别和跟踪、移动机器人定位和
HIV-1全球亚型分布不均的原因有很多,包括奠基者效应,人口增长和城市化,以及文化,性别因素,和传播联系和迁移。中国地区HIV的流行呈现主要以下特点:1)全国范围的HIV感染率低,但是部
近年来,随着半导体行业的迅速发展,大规模集成电路的集成度越来越高,便携式电子产品的功能也越来越强大,以最常见的移动通信设备手机来说,已经集无线通信、MP3播放、视频播放、数
突触传递是神经系统实现功能最基本的方式。神经末梢突触前膜通过突触囊泡(synaptic vesicles,SV)存储和释放神经递质,保证神经信号的正常传导。之后突触囊泡元件通过内吞作用回
随着煤矿开采深度的增加,突水、矿震、冲击矿压、顶板大面积垮落等地质动力灾害发生的概率也在逐渐增大,这些动力灾害的发生与灾害源附近围岩应力失衡有着密切的关系。地应力数
乙酰辅酶A连接酶(ACS)属于腺苷酸合成酶超基因家族,与4-香豆酸辅酶A连接酶(4CL)有着紧密的进化关系。本实验室已成功从植物毛白杨中克隆得到5个4CL基因,并从植物毛果杨中克隆得
非可控性炎症与多种慢性炎症性疾病关系密切,如多发性硬化症、动脉粥样硬化等。然而,关于非可控性炎症发展的机制并不是非常清楚。很多证据表明粘附分子CD146参与了多种慢性炎
电容式微机械加速度传感器是重要的惯性器件之一,具有体积小、成本低、功耗低等优点,在生产生活各个领域得到了广泛的应用。随着科学技术的发展,对微加速度计提出了越来越高
随着超短超强激光技术的发展,激光脉冲的输出功率已达到TW、PW量级,激发了人们对超短超强激光与物质相互作用的研究热情。作为介于原子分子与固体之间的特殊物质形态,强激光与团
目前,人类所用的能源主要是石油、天然气和煤炭等化石燃料,但是它们的大量使用会导致能源枯竭和相当严重的环境问题。为了实现经济和环境的和谐发展,可再生的生物质能源已成为世