语音情感识别中语谱图纹理特征提取算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:zhou8859
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,传统的语音情感特征主要有音质特征、韵律学特征和频谱特征等,都单一地集中于语音的时域或者频域,而很少考虑语音的时频相关特性,使得提取的特征不充分。语谱图能够很好地联通语音的时频两域,使得研究语音的时频相关性变成可能。基于此,本文从以下两个方面开展语谱图的纹理特征提取研究:1)针对完全局部二值模式(Complete Local Binary Pattern,CLBP)特征维度高,且在缺失中心像素点的情况下又过分依赖中心像素点的不足,构建了均匀完全局部二值符号模式(UniformCLBP_Sign,UCLBP_S)和改进幅度模式(Improved CLBP__Magnitude,ICLBP_M)。同时,针对经典决策级加权投票融合方法在分类器识别性能大体相同时无法发挥作用的缺点,提出幂指数加权融合方法。首先,将原始语音样本转化为语谱图,再使用多尺度、多方向的Log-Gabor滤波器对语谱图做处理,放大语谱图的细节信息;然后提取语谱图的UCLBP_S和ICLBP__M的分块直方图特征,之后串联两种特征作为新的融合特征ICLBP_S_M。最后,基于SVM对三种特征进行决策级幂指数加权融合完成语音情感识别。2)针对韦伯局部描述(Weber Local Descriptor,WLD)算子不能很好地表征语谱图对角线方向上梯度变化信息的缺点,构建了多方向韦伯局部描述(More Direction WLD,MD WLD)算子。同时,针对于梯度中心对称局部方向模式(Gradient Center-Symmetric Local Directional Pattern,GCS-LDP)不能表征图像梯度间边缘响应值变化的幅值信息,构建了完全梯度中心对称局部方向模式(Complete GCS-LDP,CGCS-LDP)。为了弥补单一纹理特征表征图像纹理信息的不足,在获取语谱图Log-Gabor图谱的基础上,提取语音样本ICLBP_S_M特征、MDWLD特征和CGCS-LDP融合特征,并且对这三种特征进行决策级融合,完成语音情感识别。实验结果表明本文算法能够有效地提高语音情感识别系统的性能。
其他文献
造成交通事故的原因主要由人、车、路和环境四个基本要素组成.在这四个基本要素中,人是控制交通事故的关键因素.现结合我国交通实际,通过对人的行为因素的分析,阐述人的行为
介绍了空调冷源方案设计的基础条件及一般规定,并对目前空气调节系统冷热源及设备选择常用的组合方案及选择冷水机组过程中应考虑的问题进行了分析,最终达到提高能源利用率、节
介绍了基于数字信号处理器(Digital Signal Processor,DSP)的永磁同步电机(Permanet Magnet Synch Motor,PMSM)全数字化伺服系统控制方案,并给出了软件流程。文中分析了系统中影响可
电视新闻访谈节目首先是一则新闻节目,进而它是一档访谈节目,因此它必须包含有对话题的解读、对话题的引导。因而,对于电视新闻谈话节目的主持人而言,如何引导话题就显得格外
植物寄生线虫是一类严重为害我国农作物、畜牧业和人类健康的有害生物。据不完全统计,根结线虫造成的年损失率约为10%,全世界每年因根结线虫为害所造成的农作物经济损失约在1000
本文采用荧光分光光度法测定血清中诺氟沙星浓度。用三氯醋酸为蛋白沉淀剂,以NaOH调pH至弱酸性,加醋酸-醋酸钠缓冲液后测荧光强度。激发波长为335nm,发射波长为450nm,浓度在0~8μg/ml范围内呈良好线性关系
近年来,围手术期目标导向液体治疗(goal-directed fluid therapy,GDFT)在术中的应用是麻醉学科的一个热点问题。围手术期GDFT是维持理想容量状态的个体化输液方案,该方案可缩
高校图书馆馆藏结构优化对于提高图书馆效益及服务教学科研能力都具有积极作用.目前高校图书馆馆藏结构优化主要存在认识不够,重视程度不够,馆藏资源与用户需求不相适应,馆藏
有梭梭群落和骆驼刺群落覆盖的沙地土壤剖面的含水量与裸沙地含水量显著不同,与前者相比,裸沙地土壤水分无明显的层次性变化,受降水及蒸发等因子影响明显.不同植物群落沙地土
对轧钢厂650轧机后升降台的驱动方式改造进行探讨,对目前采用传统的“重锤平衡,曲柄连杆机构形式改用液压驱动。降低维护成本和减少检修维护时间。