仿选择性注意机制的语音情感识别算法

来源 :声学学报 | 被引量 : 0次 | 上传用户:hfg595
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
有效特征的选取一直都是语音情感识别算法的关键。为此,针对语音情感特征选择与构建的问题,一种仿选择性注意机制的语音情感识别算法被提出。考虑到语音信号的时频特性,算法首先计算语音信号的语谱图;其次,模仿选择性注意机制,计算语谱图的颜色、方向和亮度特征图,归一化后形成特征矩阵;然后,将特征矩阵重排列并进行PCA降维,形成情感识别特征向量;最后,利用改进的支持向量机分类方法进行语音情感识别。对愤怒、恐惧、高兴、悲伤和惊奇5种情感的识别实验显示,基于选择性注意的方法能够获得较好的识别效果,平均识别率为85.44%。相比于韵律特征和音质特征,语音情感识别率至少提高10%;相比于其它语谱特征,识别率提高7%左右。 The selection of effective features has always been the key to voice emotion recognition algorithm. Therefore, aiming at the problem of the selection and construction of speech emotion features, a speech emotion recognition algorithm imitating selective attention mechanism is proposed. Taking into account the time-frequency characteristics of the speech signal, the algorithm first calculates the speech spectrum of the speech signal. Secondly, it simulates the selective attention mechanism to calculate the color, direction and brightness features of the spectrogram and normalizes them to form the eigenmatrix. The feature matrix is ​​rearranged and PCA dimensionality reduction is performed to form the emotion recognition feature vector. Finally, the speech recognition is improved by using the improved support vector machine classification method. Experiments on identifying five emotions of anger, fear, happiness, sadness and surprise show that the method based on selective attention can achieve better recognition results with an average recognition rate of 85.44%. Compared with the prosodic feature and the sound quality feature, the recognition rate of speech emotion is increased by at least 10%, and the recognition rate is improved by about 7% compared with other speech feature.
其他文献
大学生抵御外来西方文化霸权的精神来源和其成为国之栋梁的要求就是要拥有高度的文化自信,当前部分大学生对中国文化极其不自信.人类文明中主要交流工具便是本土语言,不但发
针对合成孔径雷达(SAR)图像和可见光图像融合问题,提出一种基于非下采样剪切波变换域的隐马尔可夫树模型的图像融合方法 (NHMM),图像经过非下采样剪切波变换(NSST)分解形成一
美的回廊──访《日本经济新闻》论说兼编辑委员今泉恂之介刘明华西方报界的竞争是多方面的。消息报道要抢时间、比深度,无疑是竞争的主战场;但副刊也不例外。随着休息日的增加
得改革开放风气之先的广东新闻界,如何更好地以正确的舆论引导人,弘扬时代主旋律,为经济腾飞和社会发展服务;在办好报纸、广播、电视,并向现代化媒介集团进军过程中形成了怎
日本NEC公司生产的NC-840B型彩色摄象机,其灵敏度比普通CCD摄象机高约4000倍。它具有遥控功能,能在白天和夜间工作。不带透镜系统,售价350万日元(合35000美元)。为了增强灵敏度,该摄
刘荣惠评《西安晚报》“外向型城市·西安人”专栏这专栏过去我断断续续看过几间,今天一口气读完,感到《西安晚报》办的这个专栏,对进一步解放人们的思想,更新观念,很有意义。不仅
加强深度报道办出产业报特色周永仙特色是产业报的生命。办出产业报特色的关键,在于加强深度报道。一般来说,深度报道具有背景丰厚、内容翔实、分析深透的特点,而产业报由于对本
3月1日,《辽宁日报》刊登了该报记者于慧彬 “现身说法” 式的报道:花去200元钱——买回3个 “国际美容师”。文章披露了一个令人难以置信的 事实:这位记者既没有到过给她开
《新垒》的艺术价值首先体现在它的形式多样。不仅小说、诗歌、戏剧、散文、理论批评、翻译等等一应俱全,使它在文体方面呈现多彩多姿,也体现了主编者在文体多样化探索,理论批评
踏破铁鞋无觅处 得来全不费功夫 记者的职责告诉我们,寻找新时代的焦裕禄,为我们党的干部队伍树立一个学习的榜样,也是现实时代的需要。记者深知,在我们党的干部队伍中是不