基于压缩感知的说话人识别技术的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:luzhiqing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和网络通信的快速发展,人们对信息安全性的要求越来越高,说话人识别技术,凭借其较高的安全性和便捷的使用方式,广泛地被应用于互联网和通信领域,完整的说话人识别系统由预处理、特征提取、模式匹配和判定这几块共同构成,自Bell实验室的L.G.Kesta提出了“声纹”的概念后,大量学者针对说话人识别技术中不同模块展开研究,收获颇丰。目前,与文本相关的说话人识别技术的研究相对较为成熟,识别性能较好,但是与文本无关的说话人识别技术性能的提升空间还很大,除此之外,由于现实生活中绝大部分的语音信号都含有噪音,而传统的说话人识别算法大多针对干净语音,因此寻找一种鲁棒性较好的说话人识别技术也迫在眉睫。另一方面,近几年,压缩感知理论受到国内外的广泛关注,该理论突破了奈奎斯特采样速率的限制,对可压缩信号在采样的同时也进行压缩,将压缩感知这一新理论与说话人识别这一亟需突破的领域相结合,为说话人识别系统性能的提升带来希望,具有重大的实际应用价值。  本文在对压缩感知理论和说话人识别技术进行深入学习的基础上,针对与文本无关的说话人识别技术,做了以下工作:  1)研究了稀疏表示理论在模式识别领域中应用,分析了稀疏表示理论和压缩感知的联系与区别,提出用组合特征矢量训练GMM均值超向量,并以此为基础构建稀疏基,随后提出了一种基于压缩感知稀疏表示的说话人识别算法,为两种理论的结合开辟了思路;  2)深入研究了贝叶斯框架下的压缩感知算法,给出了区别于传统重建算法的贝叶斯重建算法,鉴于该算法得到的解更接近于最小l0范数的解,率先提出了基于贝叶斯压缩感知的说话人识别算法;  3)针对基于压缩感知的说话人识别算法中的稀疏系数的特点,引入半高斯先验,详细分析基于该先验的贝叶斯压缩感知后,提出基于近似贝叶斯压缩感知的说话人识别算法;  4)针对说话人识别系统在噪声环境下识别率普遍较低的问题,在详细分析语音信号和噪声信号稀疏性差异后,提出了一种基于压缩感知的语音增强算法,并将其应用在说话人识别前端。  本文最后对所做的工作和成果做了总结,并对今后的工作进行了展望。
其他文献
人们在开玩笑时,常说对方:“我看你有病,是神经病!”这句话的意思指的是对方精神不正常,有精神病.
期刊
上一讲已经介绍了精神障碍的分类,其中有重性精神病,如精神分裂症,也有与身体疾病有关的器质性精神障碍,也有与情绪有关的心境障碍等等.
网络电话技术,通常叫做VoIP(Voice over Internet Protocol),则是通过因特网来实现两端实时通话和多媒体传输的技术。目前VoIP相比较传统的电话,凭借其低费率和高质量通信被越来
组合导航系统是提高导航系统性能价格比的有效途径。随着信息融合技术的发展,联邦滤波理论由于可以灵活地设计出精度最优或容错能力最强的组合导航系统,已受到导航界的高度重视
期刊
随意运动功能的减退或丧失称为瘫痪.瘫痪按其损害分布范围可分为:偏瘫、单瘫、截瘫、交叉瘫等;按肌张力状态可分为迟缓性瘫痪(软瘫)与痉挛性瘫痪(硬瘫);按病变的解剖部位可分
多天线发送多天线接收(MIMO)和正交频分复用(OFDM)两种技术的结合被认为是未来无线宽带通信最有效的传输技术之一,既可以很好的解决未来宽带无线通信系统中信道的多径衰落和
期刊
期刊