文本无关说话人确认及其应用研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:xjqlhh0621
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要讲述基于全背景-高斯混合模型(UBM-GMM)的说话人确认系统。首先在实现基本系统的基础上,我们通过录制新的语音库,增加了基于短时能量和短时过零率的双门限端点检测等措施,使系统的识别精度达到了一个比较高的水准。然后又针对系统运行时间过长效率较低的现象,提出了只抽取语音中最能有效反应说话人个性特征的部分进行特征参数的提取,以降低系统数据量。然后通过实验进行验证,通过结果可以看出,经过如此改进后系统的精度依然能够保持原来的水准,而系统的运行时间却降至约为原来的三分之一左右,大大提高了系统的效率,也基本达到了我们的预期目的。论文首先对说话人识别的背景、研究意义及近些年来的发展现状做了一个详细的论述,并指出了当前仍存在的难点问题,然后对本文要做的工作做一个概要的介绍。然后,按照UBM-GMM说话人确认系统的流程依次对系统的各个部分进行理论和具体实现的介绍。在本文中我们采用DET曲线来评价系统的性能,该曲线的横、竖坐标分别代表错误拒绝率和错误接受率,横竖坐标相同的点的坐标值便是系统的平均错误识别率。我们在原系统的基础上增加了双门限端点检测的方法,并针对原语音库信噪比较低的情况重新录制了质量比较高的语音库,从而使得系统的精度达到了一个比较高的水平。但在实验的过程中我们也感受到,由于数据量比较大,导致系统的运行时间比较长,这在实际应用中特别是在实时的情况下显然是不够的,针对这种情况我们进一步提出了降低系统运行时间,提高系统效率的目标。我们首先对被测试语句进行分帧打分,观察总结出语音中得分比较高的部分,并对该部分进行短时能量和短时过零率的分析,然后设定出对该部分进行抽取的短时能量和过零率的门限值。经过只抽取最能有效反映说话人个性特征信息的语音段进行特征提取的改进之后,我们首先对系统前后的识别率进行对比,发现系统的识别率依然能保持原有的较高水准。然后进行系统运行时间的对比,通过实验结果我们可以看出,改进后的系统运行时间有较大幅的下降,只为原来的三分之一多一点,从而说明了本文所做的改进基本达到了预期的效果。最后本文讲述了基于普适计算的E-Learning系统,并对说话人确认系统在其中的应用做了概要的介绍。
其他文献
基于外辐射源的无源雷达系统相比于传统雷达系统具有许多优势。因其反隐身、反侦察、抗干扰等诸多优点受到雷达界的密切关注。目前,在基于FM、DVBT、GSM等信号上的无源雷达研
近年来,城市车辆数量快速增长,道路交通系统面临诸多挑战,促使车载自组织网络(VANET)得到了广泛研究和发展。其中,IEEE1609.4标准为VANET提供了多信道操作,其目的是保证安全应用的可
智能视频监控系统是一门集通信、计算机视觉、数字视频、运动目标检测跟踪等技术为一体的综合系统,随着视频信息处理技术的发展,全数字化、网络化的视频监控系统优势越来越明显
频率合成器是现代射频测量仪器和电子通信系统中不可或缺的一部分,在诸多领域有着广泛的应用。随着各种新技术的不断发展,对频率合成器的性能指标要求愈来愈高。低成本、宽频带
随着近年来宽带无线业务的持续发展,频谱资源的匮乏的问题正日益成为制约无线通信系统发展的瓶颈。而人们发现在某些频谱资源上承载了很大的业务量,而另外一些频段资源利用率
随着宽带无线通信和移动互联网的飞速发展,有限的频谱资源和固定频谱分配方式,造成频谱的浪费和授权频段利用率低下。认知无线电(CR)技术的提出,解决了频谱资源不足的瓶颈问题, CR
本文是以风管清洁机器人平台为基础,对风管清洁机器人的避碰技术做了研究。首先,本文在查阅并研究了大量风管清洁机器人的资料的基础上,阐明了风管清洁机器人的研究背景和意
云计算作为并行计算、网格计算和P2P计算的发展和融合,是一种商业计算模式,其利用虚拟化技术,按需向用户提供计算服务、存储服务和软件服务,得到了越来越广泛的应用。安全是云服
作为光全息术一类延伸技术,微波全息术由于能够有效获得目标微波图像,因此,成为当前全息显示技术领域一个重要组成部分。目前,微波全息技术已经广泛应用于雷达成像、全息天线、安
管道漏磁检测技术是当今无损检测技术领域的研究热点之一。漏磁检测技术具有较高的检测可靠性和检测速度,已经被广泛地运用于管道的检测中。本文首先研究了管道漏磁检测原理