声纹身份识别中非常态语音应对方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:boluoqb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物信息技术迅猛发展,传统口令访问各类门禁安防系统的方式,难以满足用户对安全便捷方式的追求。而语音生物特征以获取方便,使用简单且不易被入侵等特点广泛应用于声纹身份识别领域。目前,各类声纹身份识别系统在安静环境和说话人语音正常情况下能获得较高识别率,但当面临各类非常态语音时(如:复杂背景噪声的语音、故意改变说话方式或习惯的语音、发音器官病变的语音等)其性能急剧下降。于是以非常态语音作为研究对象的语音信号处理技术受到广泛关注,并发展成为研究热点之一。现实生活中,说话人的语音极易产生病理性非常态现象,如:感冒、反胃酸、咽喉炎、声带发炎、鼻塞、醉酒等。为提高声纹身份识别系统的普适性,降低系统对非常态语音的拒识率。本文以病理性非常态语音中的感冒语音为研究对象,探索非常态连续语音的快速检测、与文本无关的非常态连续语音中变异特征的动态加权及最优说话人共同向量提取,主要贡献如下:1)病变非常态连续语音的检测算法。针对人为设定最优采样延迟和最优嵌入相关维的病变元音检测算法,不能客观有效地描述病变连续语音发音系统复杂性的缺陷,提出了一种基于相关维的病变非常态连续语音检测算法。通过分析信号频率,获得合理采样延迟范围,然后在合理采样延迟区间内调整采样延迟以获取相应嵌入相关维,最后对嵌入相关维进行等错率分析,将等错率最小的嵌入相关维和其对应的采样延迟视为最优混沌参数。实验结果表明:该算法的区分正确率为75.6%,分别比GMM-SVM,Shimmer,人为设定采样延迟和固定嵌入相关维算法,SHR算法和Jitter算法提高了7.8%,9.3%,16%,18%和20.4%。2)变异特征动态加权补偿算法。针对传统加权算法难以动态跟踪各阶特征变异的缺陷,提出一种变异特征动态加权补偿的非常态语音应对算法。分别利用K-L距离和欧氏距离,动态跟踪非常态语音与常态语音特征的差异程度,并对变异特征进行加权补偿。实验结果表明:通过异常特征的K-L和欧氏加权补偿后,声纹身份识别系统对非常态语音的识别率分别为46.61%和42.25%,比传统加权算法和不加权算法的识别率分别提高6.93%、10.25%和2.57%、5.89%。当面临轻微异常语音时,经过本文的K-L加权算法处理后,系统识别率为83.77%,与传统加权算法和不加权算法相比,系统识别率分别提高了16.51%和17.53%。3)非常态语音的最优说话人共同特征提取算法。从探索说话人常态语音和非常态语音的相对稳定,且有一定区分性的共同特征出发,引入说话人共同特征向量,并通过自适应调整共同向量参数以克服人为设定参数不客观的缺陷。提出一种非常态语音最优说话人共同特征提取算法。通过不断调整共同向量参数,使系统获得最优说话人识别率,并把最优识别率的参数视为最优共同参数。然后利用最优共同向量参数为测试语音提取共同向量,并用SVM分类器进行非常态语音说话人识别。实验结果表明:经过该算法的处理,系统的轻微非常态语音说话人识别率为85.4%,比GMM、SVM和结合共同向量和GMM算法识别率分别提高了16.9%、15.2%和3.2%。系统的非常态语音说话人整体识别率为51.8%,比GMM、SVM和结合共同向量与GMM算法的识别率分别提高了10%、8.6%和2%。4)最小模型距离的非常态语音说话人聚类。针对传统聚类算法性能严重依赖于预先设置的最优聚类参数的缺陷(最优聚类参数往往较难获得),在使用两层相似度判决克服预先设置聚类参数算法缺陷的基础上,提出基于最小GMM距离动态追踪的非常态语音说话人聚类算法。在对说话人高斯模型进行最小巴氏距离追踪的基础上,建立疑聚类集,在对疑聚类集中的说话人语音集进行聚类时采用两层相似度说话确认。实验结果表明:本章所提算法的Fscore为69.08%,比K-means的Fscore和ISODATA算法的Fscore分别提高1.99%和0.95%。同时,采用两层相似度判决时,本章算法的平均类纯度(ACP)比一层相似度判决的提高5%,平均说话人纯度(ASP)比一层相似度判决的提高8.8%。同时,采用两层相似度判决比一层相似度判决的Fscore提高了7.08%。
其他文献
在临床工作中发现纤毛菌性阴道炎感染率有升高的趋势,而且对其却存在很多认识盲区。本研究回顾10年来吉林大学第一医院17682例妇科门诊病人阴道分泌物涂片的常规检验结果,对纤
[摘 要] 在经济全球化趋势日益明显的今天,为了抢占国际竞争力的制高点,各国各地区都高度重视发展高新技术产业集群。本文深入研究了高新技术产业集群与知识创新二者之间的关系,得出建立有效的知识创新体系与机制对经济发展具有重要意义。  [关键词] 高新技术、产业集群、知识创新     高新技术产业是由处于时代前沿的先导性技术发展起来的产业。与传统产业相比,高新技术产业是一种具有高技术、高投入、高风险、高
频率资源稀缺和节省能耗是当前无线通信研究中的两个重要问题。为此,我们以无线通信中高频谱效率和高能量效率的功率管理作为本论文的研究对象。为了提高频谱利用率,本文研究
目的评价前哨淋巴结(SLN)活检及其微转移检测临床意义。方法本组46例原发性乳腺癌患者,应用美蓝进行前哨淋巴结定位和活检,随后行腋窝淋巴结清扫(ALND),行SLN、腋淋巴结(ALN)
2003年6月~2004年 2月,我们采用韩国GM商社的CDS包皮除去环行包皮环扎术治疗成人包皮过长患者54例,现报道如下.
目的探讨先天性中性粒细胞减少症(SCN)的临床特征及发病机制。方法采用聚合酶链反应和直接测序技术依次分析1例临床诊断为SCN患儿的ELANE、HAX1、WAS、GFI1、CSF3R及CXCR4基
目的:通过对古代和现代文献的分析和思考,说明应该在周围性面瘫急性期的治疗过程中选择艾灸疗法进行治疗。方法:对古代文献进行剖析,对现代研究的机制进行探讨,来总结运用艾
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的了解马鞍山市售食品中化学性污染物的污染状况,为逐步建立食品化学性污染监测和预警系统,制定监管和控制措施提供科学依据。方法按国家《化学性污染物及有害因素监测工作