语音参数提取算法研究及系统实现

来源 :重庆大学 | 被引量 : 0次 | 上传用户:hjy2673237
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术根据语音中反映说话人生理和行为的特征参数自动识别说话人身份,被认为是最自然的生物认证技术之一。特征参数提取是说话人识别中的核心部分,而找到一种简单可靠的特征参数非常困难,如果识别过程是在噪声环境下进行的,识别率更会明显降低。本论文在较为深入地研究了基音周期(pitch)、线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)等语音特征的基础上,针对特征参数的稳定性、准确性和鲁棒性开展了以下工作:(1)传统参数提取方法中,固定窗长加窗会降低语音的短时稳定性,并导致不同程度的谐波泄露。本论文提出了一种基音同步可变窗长加窗语音参数提取预处理方法,以取代传统固定窗长加窗。首先,检测语音同步基音周期,由检测结果决定窗长,即只保留语音中具有完整周期性的部分作为分析帧,之后提取该分析帧特征参数。实验结果证明,说话人确认算法中,若在LPCC参数和MFCC参数提取前使用该预处理,识别率将有一定提高。(2)由于使用基音同步可变窗长加窗预处理的语音将保留更多高频信息,同时,语音的高频部分通过该预处理后频谱距离将有明显降低,又由于噪声声压级随频率的增加会逐步降低这一特点,本论文对采用基音同步可变窗长加窗语音参数提取预处理后的语音,在提取MFCC参数时进行高频部分加权处理。实验结果表明,该方法有利于提高语音噪声鲁棒性,并进一步提高识别率。(3)在确定了本论文提出算法的有效性后,采用提出的基音周期可变窗长加窗预处理高频加权MFCC参数提取方法及传统MFCC参数提取方法研制开发了用于实时说话人识别的原型系统,该系统具有高识别率、抗噪性等优点,能够满足办公室、家居环境下较少用户说话人识别要求。
其他文献
笔者自1995年采用B超引导穿刺抽脓治疗小儿肝脓肿,收到了良好效果。1 临床资料本组28例,B超引导穿刺抽脓15例,手术引流7例,抗生素保守治疗6例。经穿刺抽脓治疗患儿男9例,女6例
利用班玛县1965—2017年近56a的年均降雹日数、冰雹灾害发生频次等气象资料;人口密度、载畜量、可利用草场面积比、人均GDP等社会经济资料;DEM高程资料和乡镇的行政边界资料
报告18例原发性输尿管癌,均为移行上皮癌。结合文献就其诊断与治疗进行了讨论。介绍了B超、IVU、RP、膀胱镜检查、CT扫描及尿脱落细胞学检查对本病的诊断价值。强调逆行肾盂输
在我国广大农村.虽然生活水平在不断提高.但在烧火做饭问题上.大部分农户仍在使用传统甫老的土灶.由于柴草是在直接燃烧.致使农户厨房不可避免地产生烟熏火燎的现象.烟尘污染严重.极
随着我国中小学教师继续教育工程的不断深化,我国的教师继续教育工程进入形成与发展期,并不断向制度化方向迈进。在教师教育教材市场不断繁荣的同时,教师继续教育教材管理也
张杰 编 唐筠画  今年的8月8日,第29届奥运会就要在北京举行了。到时候,北京一定非常热闹! 本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
期刊
有色重金属冶炼行业一直是我国污染大户,其产生废水量大,重金属种类多,含量高。目前我国95%以上有色重金属废水均采用石灰中和法处理,处理后中和净化废水中含有大量的钙离子及微量
目的:探讨医护一体层级护理模式在预防经皮肾镜取石患者术后并发症中的应用效果。方法:将150例经皮肾镜取石患者按照入院顺序号分为观察组和对照组各75例。对照组采取围术期
为进一步认识闪电放电对夏季青藏高原地区臭氧低值区形成的可能影响,本文利用2005年-2013年星载光学瞬变探测器O TD和闪电成像仪LIS资料合成的LIS/OTD2.3版本再分析格点资料