基于支持向量数据描述的说话人识别研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:ydaf5hv2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术由于其独特的便利性、精确性和经济性,被认为是最自然的生物认证技术,在安全监控、司法鉴定、电子侦听、金融服务等方面都具有广泛的应用前景。当前,说话人识别系统开发已逐渐从理论研究转向实际应用,对其要求也随着应用环境的变化而越来越高,不仅期望具有极高的识别率,还要具有较高的实时性。此外,系统构建的便捷性、模型扩展能力等都不容忽视。近十几年来,基于核函数的分类算法已成为模式识别领域的研究焦点,它有效克服了传统模式识别方法中局部极小和非完全统计分析的缺点,具有很强的非线性处理能力,而说话人识别系统中输入的语音特征参数正好是非线性的且局部特性复杂。因此,本文提出密度诱导型数据描述单类分类机,将其应用于说话人识别时能够获得很好的效果。本文以小样本语料库为应用对象,针对说话人识别中的辨认任务,提出了具有较好的核分类方法。主要工作如下:(1)详细介绍说话人识别中应用最为广泛的两类特征参数LPCC和MFCC以及他们的提取过程和方法。(2)介绍了支持向量机的基本理论。经典的支持向量机只支持二元分类的情况,我们借助“一对一”或“一对多”技术对其进行多元扩展并应用于说话人识别(3)将支持向量数据描述(SVDD)应用于说话人识别,SVDD在训练过程中只需单类样本,可以胜任多分类任务。为适应开集辨认任务提出了密度诱导型数据描述单类分类机(DISVDD),此算法以支持向量域描述(SVDD)算法为基础,通过一种简易的形式引入数据间密度因子,使处于不同区域的数据对分类器的作用不再被同等对待,高密度区数据对分类支撑域的作用被强化,而低密区即呈零星分布的数据作用被削弱,结果使分类超球体自动靠近数据高密区而提高其识别性能。说话人辨认实验结果表明,DISVDD模型的识别性能全面优于GMM。(4)针对越来越多的场合需要利用生物识别技术来提高信息的安全性,本文将DISVDD应用于声纹锁中,使用该算法可以在一定程度上提升系统的实时性及准确率。(5)最后,对本文工作进行了总结,并对声纹识别系统的进一步研究进行了展望。
其他文献
军队无论是执行作战训练任务还是应对重大突发公共事件,快捷高效地实施兵力投送都是首要的决定性因素。兵力投送军事行动通常要求时间最短、损耗最少、风险最低,而这些目标通
近年来,切换系统的研究取得了长足的发展,由于不确定性和时滞因素在实际系统中广泛存在,因此,针对切换系统在参数不确定和时滞情况下的鲁棒分析和控制方法的研究在理论和应用
在工业控制过程中,被控对象通常具有严重的纯滞后、时变性、非线性以及存在种类繁多的干扰,传统的控制方法已经无法满足各方面的控制要求。本文在对PID控制、自适应控制、Smi
信号在采集和传输过程中,不可避免地会受到各种噪声的干扰,如何合理地进行数据预处理,提取出较为真实可信的信号是信号处理领域中的一个重要研究课题。本文围绕着课题组中一
多无人水下航行器(MultipleUnmanned Underwater Vehicle/UUVs)作为一类重要的水下作业工具,其在海底资源勘探、水下油气开发及海洋军事侦察等领域发挥着越来越重要的作用。与
本论文是结合科研项目进行的,主要对大型试验水池集控系统进行了设计研究:由于水池试验耗费大、试验过程复杂、试验现场潮湿、电磁干扰严重等问题的存在,性能良好的、能确保
随着国民经济迅猛发展,人们对铝的需求越来越大,同时由于原材料、能源的日趋紧张,国家提倡低碳高效的政策,因此如何提高铝电解效率,延长电解槽使用周期,节约能源成了铝电解行
本论文旨在对图像进行多尺度分析和研究。在数字图像处理中,进行有效的图像分离工作的重要性不言而喻。MCA是BP和MP算法的合成,以实现用最优稀疏表示图像形态。图像边缘检测
人脸识别是人脸信息处理中的一项关键技术,近年来在计算机视觉与模式识别领域中己经成为一个十分活跃的研究方向,具有极高的学术研究价值和商业应用价值。到目前为止,虽然已
绝热材料具有保温、隔热的作用,国外将绝热材料看作是继煤炭、石油、天然气、核能之后的“第五大能源”。正确评估绝热材料最高使用温度,是保证绝热材料在使用温度下正常使用