基于参数迁移和C-LSTM的说话人识别研究

来源 :电声技术 | 被引量 : 0次 | 上传用户:sjt111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在说话人识别研究中,现有的深度学习方法大多只考虑了语音的空间特征或时序特征,且模型训练时间长、识别准确率低。语谱图是语音信号转换后在时频两域均具有独立特征的特殊图像。为了充分提取语谱图时频两域的情感特征,结合卷积神经网络(Convolutional Neural Networks,CNN)和长短时记忆(Long Short-Term Memory,LSTM)网络的特点,提出了一种基于参数迁移和C-LSTM的说话人识别方法。该方法以语谱图作为网络输入,利用CNN进行训练得到预训练模型并迁移参数,之后将CNN
其他文献
随着交通意外等伤害事件的增加,锁骨骨折发病率有所上升。因多为高能量损伤,故骨折多为粉碎,并且移位大,畸形明显,严重影响外观及功能,我院自1999年4月~2006年11月,共收治了217例锁骨
豆渣是大豆加工成分离蛋白或传统豆制品等所留下的副产物,就豆渣中膳食纤维国内外的应用现状和功能特性进行阐述,为豆渣中膳食纤维的开发与利用提供理论支持。
简述了目前用于我省跨省计量关口上的多功能电能表的主要功能及开展应用的情况。
论述了电磁距单向三角高程测量在采用两个标高时,不同条件下所能达到的精度,并结合在滑坡监测中视其垂直形变速率的大小使用的可能性。最后用某滑坡监测多年的资料分析,难了该方
运用有效的云综艺制播模式创新策略,可在综艺制播中持续发挥云综艺制播模式的优势。基于此,阐述树立科学的制播创新理念、强化技术支持、培养工作者创新意识及构建创新机制等