论文部分内容阅读
真实语音情感识别是使人机交互更加友好的重要手段,但是训练数据稀缺为这一领域带来很多挑战。为了减小这一阻碍,提出了语句串接与重采样(UCR)方法,以便高效利用存在的训练数据。UCR方法是将原始音频样本按照情感类型进行串接,形成一个长的音频流,以一个固定粒度对其随机乱序,然后将其切割,并通过多次重采样操作来增加支持向量机(SVM)的训练样本数。实验基于一个从访谈节目中录制的真实语音情感库。实验结果表明,在统一背景模型-高斯混合模型-支持向量机(UBM—GMM—SVM)识别框架中这种训练集重构的方法错误率