语音个性特征识别及转化系统研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:sychf1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信号处理、人工智能、互联网等技术的蓬勃发展,各类多媒体应用逐步融入人们生活的方方面面。图像、视频等相关技术相继被应用于实际场景,如人脸识别、指纹识别、视频事件检测、3D电影等,使人们的生活变得日益丰富多彩。语音处理的相关技术则明显滞后,尤其是语音的个性特征方面。这主要源于语音信号的数据量巨大,且极不平稳,难于建模。语音处理技术越来越受到重视,国内外众多学者发表了大量相关方面的研究成果,但目前能应用于实际,并且取得很好效果的应用寥寥无几,还有待进一步的研究。本文阐述了语音信号处理方面的相关技术,着重对语音个性特征的提取、建模、识别、转化等方面进行了研究。提出了一系列改进方法和创新方法,主要包括以下几个方面:1)提出一种高精度、大尺度、抗噪声干扰的语音基频校正方法,实验表明该方法在大尺度预估偏差、强噪声干扰下能有效地校正基频轨迹;另外还提出一种改进的抗周期干扰与短时平稳性的语音谱提取方法,截取较短的时域信号时即可获得平稳的谱序列。2)利用高斯混合模型GMM对语音参数进行概率分布建模,并提出了一种基于GMM比重矢量距离的特征识别方法;另外挖掘出谱包络残差、基频抖动谱这两个语音个性特征,并建立相应的模型,用于综合识别,实验表明这一系列方法可使得识别的平均正确率达到90%以上。3)提出了一种基于GMM立建模、联合匹配的转化方法,用于语音谱包络、基频轨迹的转化,极大降低了训练、转化的计算复杂度;并且利用该原理,实现了一套语音个性特征转化系统,取得了很好的转化效果。
其他文献
随着智能交通大趋势的不断推进,车载自组织网络(Vehic le Ad-Hoc Network,简称VANET)已成为当前学界和工业界的研究热点。VANET中多跳广播技术可用于发现车辆附近的节点或者
智能小区无线抄表系统用于现代城市智能化小区的无线抄表,解决了过去靠人工入户抄 表的难题,使水、电等服务公司的抄表业务实现了信息化和智能化。
会计师事务所作为社会审计中介机构,受托对公司的经营管理及财务状况出具审计、咨询等报告,对促进公司合规、合法、有序经营发挥了积极的作用,对我国社会主义市场经济的快速
颈动脉体位于颈动脉分叉处,是重要的外周化学感受器,其功能主要是感受动脉血氧分压(PaO2)、二氧化碳分压(PaCO2)和pH值的变化,从而调节呼吸和循环反射。近年来有研究证实,颈动脉体还