基于文本无关的说话人识别技术研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:szlucky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的工作是围绕构建一个文本无关的说话人识别系统展开的。主要研究语音的预处理、特征提取、说话人模型建立以及判决策略。并实现了基于矢量量化(VectorQuantization,VQ)和高斯混合模型(Gaussian Mixture Model,GMM)的说话人识别系统。本文的工作主要有以下几方面:在语音信号预处理方面,对语音信号进行8kHz的采样,16bit量化,然后进行预加重、分帧处理、加汉明窗。在特征提取方面,本文提取了语音信号的线性预测系数(LPC)、线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC),并在GMM系统下比较它们的优劣,实验结果表明:MFCC最优,LPCC次之,LPC最差。在识别模型方面,本文主要介绍VQ模型、隐马尔可夫模型(Hidden Markov Model,HMM)和GMM模型。并对VQ和GMM进行了测试,分别进行了说话人辨认和说话人确认实验。实验结果表明:无论是说话人辨认还是说话人确认,GMM模型的识别性能要优于VQ。针对GMM模型进行着重研究,研究了高斯混合模型的阶数对系统识别率的影响,分析了阶数过大或过小对系统的负面影响,并结合实际情况进行了选择;提出在EM算法的迭代过程中设置协方差阈值,并对不同阈值条件下的识别率进行实验对比,证明了将协方差阈值设置为0.1的普遍性和可行性;针对一般初始化参数方法提出了分裂法和k均值聚类相结合的方法,实验证明改进后的方法能有效提高识别率。最后对本文工作进行了总结,同时对未来的研究工作进行了展望。
其他文献
电力系统的运行分析及控制都是以状态测量为基础的。传统的监控与数据采集(SCADA)系统侧重于系统稳态运行情况的监测,广域测量系统(WAMS)将使电力系统的监控从稳态水平提高到动态水平,为电力系统动态分析和控制创造条件。本文结合实际科研项目,对项目中网络应用处理器(NCAP)模块的软件进行研究,构建满足实时传输要求的数据通信网络,确保测量数据快速准确上传。NCAP将测量数据汇集于调度中心,使得用户能
单元机组协调控制系统是一个分布参数、非线性、时变、大滞后、多变量紧密耦合的被控对象。本文在分析其运行特性的基础上,针对大型机组原控制系统存在的问题,通过实际工程改
群体智能可以完成个体智能难以胜任的任务,它可以通过多智能体协作来实现,多智能体协作控制研究的是大量只具简单功能的个体如何通过分布式的控制,相互合作,产生复杂的群体行
以太网技术向工业现场的推广,在生产效率的提高、产品的优化等多方面都起到了极大的推进作用。但是,在目前多种工业以太网通信协议共同发展壮大的现状下,向工业控制现场推广
本文分析了金属氧化物避雷器的电气特性,介绍了在线监测的工作原理以及几种测量方法。现场在线监测MOA时,由于受到电网谐波电压和相间干扰等因素的影响,监测泄漏电流并用快速傅里叶变换频谱分析法得到阻性基波电流,可以较好地排除干扰,可靠地反映MOA的特性。本课题采用投影法作为监测方法,提出了一种基于CAN总线的新型分布式氧化锌避雷器在线监测系统,并对系统的硬件电路及软件部分设计做了简要说明。本系统以TI公
本文针对实际系统中处理不确定因素影响的问题,研究II型模糊建模方法和基于II型模糊模型的控制方法。在模糊集合中,由于II型模糊集相比于I型模糊集,隶属度函数由一个数值扩展为
风力发电以其绿色无污染、蕴量巨大和可再生等特点受到广泛关注,如何确保风电机组的安全稳定运行,最大限度地利用风能成为重要的研究课题。本文在分析风速风向变化的非线性、非平稳性的基础上,研究了基于神经内分泌免疫调节机制的风电机组仿生偏航控制系统,以提高风电机组偏航控制的性能。论文主要做了以下几个方面的研究工作:1、对风电机组偏航控制系统工作原理及组成结构进行了研究,在建立偏航控制系统各环节数学模型的基础
远距离弱小目标的检测,由于其目标像素点个数少,大气衰减严重,目标信噪比低,缺乏几何形状和结构纹理信息,可供检测系统利用的信息少,一直都是成像制导、自动目标识别领域的一个热点
本文介绍了一种基于PC-Based的水箱智能控制系统,用以提高化工生产中水罐液位的控制速度。本文以液位控制系统为研究对象。常规PID控制器以其算法简单,鲁棒性好等特点被广泛
大型锅炉炉内煤粉的燃烧是一个发生在大空间范围、不断脉动的、具有明显三维特征的物理化学过程,因此燃烧工况的监测对于锅炉安全、经济效益、洁净运行具有重要的意义。针对