与文本无关的开集说话人识别技术研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:shahua001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,身份识别在信息安全领域发挥着越来越重要的作用。生物识别以其特有的稳定性、唯一性和方便性,逐渐成为身份识别领域中的重要研究方向。说话人识别技术是生物识别技术的一种,此技术的重点是根据说话人之间个性特征的差异来区分说话人。目前与文本相关的闭集说话人识别技术已经取得了较高的识别率,但是对于开集识别而言,识别率较低。因为开集识别要涉及到说话人辨认和阈值确认,所以辨认和阈值确认是开集识别的难点和关键。本文针对与文本无关的开集说话人识别技术,详细分析了说话人识别系统的基本原理和结构,并且对语音端点检测、特征参数提取、开集辨认、闽值确认几个部分进行了深入的研究。所做的主要工作如下:(1)预处理和语音端点检测部分,首先分析预处理和语音端点检测的重要性。然后从理论上描述基于短时能量的端点检测算法、基于短时过零率的端点检测算法、基于短时能频值的端点检测算法、基于谱熵的端点检测算法和基于改进谱熵的端点检测算法。最后对预加重和上述五个端点检测算法进行实验仿真,并对上述五个端点检测算法进行优缺点的比较。针对实验室环境下录制的说话人发音较小的特点,采用改进谱熵的端点检测算法。(2)特征提取部分,从理论上分析了参数提取方法和PCA理论。研究将PCA理论应用于特征参数的提取。仿真实验证明该方法能够在一定程度上改善识别性能,同时减少码本训练的运算时间。(3)开集辨认部分,针对传统VQ的不足,研究将FCM算法与PCA理论相结合的开集说话人辨认系统。仿真实验证明FCM+PCA具有比FCM、VQ+PCA和VQ更高的识别率。(4)开集识别部分,详细描述经典阈值、动态阈值、RS阈值的估计方法。研究将FCM+PCA辨认和RS阈值确认相结合的开集说话人识别系统。仿真实验证明此系统的EER与基于上述三种阈值的识别系统的EER相比较在一定程度上有所降低。
其他文献
学位
在日趋激烈的市场竞争中,为了扩大销售、占领市场,赊销这种销售方式应运而生,应收账款成为赊销的产物.而应收账款流动性的强弱直接影响企业的资金周转和经营业绩,如何做好应
远程的数据采集与传输系统在许多工业场合,尤其是一些分散、无人值守的场合,需要对现场的设备进行实时地采集或控制,传统的无线或者有线系统往往需要投入大量的时间、资金等
相控阵天线波束的捷变能力,使得相控阵雷达在工作时具有极强的灵活性。在雷达控制器的作用下,相控阵雷达能够自适应地调整工作参数,并在搜索、跟踪等多种工作方式之间进行切
当塑件上具有与开模方向不同的内外侧凸起、凹槽或孔(通常称为倒勾)时,一般都需要将成型倒勾的型芯做成活动型芯,在塑件脱模前,活动型芯先侧向抽 When the plastic parts ha
图像信号的采集和处理在科学研究、工农业生产、医疗卫生、公共安全等领域得到了越来越广泛的应用,而这些工作都需要一套高速的图像系统来完成。尤其是近些年来,信息化的高速
Internet在全球异构网络互连上取得了巨大的成功。随着科学技术的发展和各领域研究的不断深入,各种新型的网络开始出现,例如陆地移动网络、军事无线自组织网络、星际网络及无
近些年来我国互联网科技发展较快,在一定程度上促进了互联网金融的全面发展,市场影响范围在逐步扩大.当前互联网金融的发展能够为经济体制改革提供重要动力,使得我国原有的经
我国经济的发展主要依靠金融业的发展.而金融管理作为金融业发展的重要因素之一,对金融业发展的影响不言而喻.目前,我国金融管理经验相对落后,存在很多不足,无法满足现代经济
语音识别是人机交互技术的基础,是语音信号处理的一个重要方面,有着广阔的应用前景,对语音识别进行研究具有重要的理论价值和实际意义。语音识别是典型的多类分类问题,由于支