时变向量自回归模型在说话人识别中的应用

来源 :苏州大学 | 被引量 : 0次 | 上传用户:xy479977530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是一项根据语音信号中反映说话人生理和行为特征的语音参数,自动识别说话人的技术,是一种安全稳定的生物认证技术,具有广阔的应用前景。如何从语音信号中准确提取说话人的个性特征,是说话人识别的关键问题。本文研究与文本有关的说话人识别问题。通过对语音信号的预处理、频域及倒谱域的分析,得到了平均MEL倒谱,选取MEL倒谱峰值对应的频率为特征频率。选择其中随时间变化最大的和对应MEL倒谱峰值最大的特征频率作为本文的特征频率来进行分析。对两个特征频率Mel倒谱值序列分别建立多元线性回归模型,分离其趋势分量和波动分量。本文在TVPAR模型理论基础上进行拓展,建立时变向量自回归(TVVAR)模型,并对二元波动分量序列进行分析,进一步提取说话人语音信号的特征参数,并通过D比来评价和选择最终的识别参数。运用马氏距离,对说话人进行初步识别,达到了99.8%的识别率。为了充分利用距离的信息,对距离差的分布进行了分析,将到说话人语音模板的距离减去与到他人的距离,得到了距离差的分布情况,运用概率论的知识,将本实验的识别率提高到了100%。最后,对于每一个语音的识别,均给出了合理的可信度。实验证明,TVVAR模型可以有效的分析自协方差非平稳向量时间序列。
其他文献
煤矿行业的高速发展,对掘进机性能的提高日益迫切,需要掘进机可以快速而经济地截割坚硬的岩石,由于横轴掘进机在截割硬岩过程中具有较纵轴掘进机不可比拟的优势,目前国内对横
人为了表达情感产生了最初的声乐艺术,我国艺术领域随着应试教育的普及,越来越多的声乐教师崇拜高难度的声乐技巧,反而忽视了学生探究关于歌曲的细节处理,导致学生的音乐表现
订阅方式全国各地邮局:邮发代号14-203中国标准连续出版物号:CN23-1537/TN/ISSN 1000-9787期刊直接订阅的两种汇款方式:邮局汇款方式地址:哈尔滨市南岗区一曼街29号邮编:1500
苏国基回忆职业生涯中最难忘的一幕,就是带着装满牛奶箱的书在墨尔本参加澳大利亚特许会计师考试.rn许多会计师形容考取专业资格是有生以来最难的事,但普华永道香港税务合伙
期刊
改革开放以来,我国高速公路发展十分迅猛,为了降低运输成本,提高效率,汽车的轴重、轴数与车速都在增加,这无疑会加剧了路面破坏,重载时甚至3~5年路面就会被严重破坏,给公路建设带来
随着煤矿提升速度不断提高,立井提升安全越来越受到重视。由于矿井提升过卷事故常造成严重后果,威胁提升安全,《煤矿安全规程》规定在过卷高度或过放距离内应设有性能可靠的
在各种试探性应用中,人们发现:对于复杂的环境、交错的作业任务,单体机器人有时显得力不从心。于是,同时运用多个单体机器人,通过多机器人之间的分工协作来完成任务的思路开
在当今社会经济迅猛发展的形势下,企业要想在复杂多变且竞争激烈的市场中立足,高质量的产品是使企业立于不败之地的坚实基础。而质量管理是确保产品质量的重要手段之一,伴随着信
等离子喷涂技术是一种能够制备具有耐磨、防腐、抗高温、防氧化等功能的表面涂层的热喷涂技术。其具有喷涂材料选择范围广、成本低,制备涂层质量好、生产效率高等优点,成为国
金属铜以其良好的导电性、导热性和延展性等而被广泛地应用于电子和装饰领域。传统的氰化镀铜采用剧毒的氰化物,具有很大的安全隐患和环境污染,随着环保意识的增强,杜绝氰化电镀也逐渐被提上日程,人们迫切希望能有完全替代氰化电镀的无氰镀铜体系的出现。在对比研究多组柠檬酸镀铜体系的基础上,确定了以柠檬酸-酒石酸钾钠复配的无氰镀铜体系。针对体系中镀层平整性和结合强度问题,采用正交试验方法改进优化了添加剂的组成成分