基于SVM的话者确认关键技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:wushiguo208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着说话人识别技术的日益成熟,研究人员开始专注于研究实际应用中复杂环境下的说话人识别技术来不断提升话者识别基线系统的性能,从而逐渐将话者识别技术向实用化推进。近年来,如何提取到更具区分能力的前端特征,建立一个推广性强的说话人模型开始受到说话人识别领域各著名研究机构的重视。与此同时,复杂环境下的信道补偿以及多系统间的融合方法的研究,也日益引起越来越多研究者的关注。在这种背景下,本文从整个系统构建的角度出发,以打造一个具有国际竞争力的话者确认系统为目标,借助于SVM强大的分类能力,围绕着构成一套成功的话者确认系统最关键的核心技术:模型训练,信道补偿、得分融合以及最重要的特征提取这四个方面展开了较系统而深入的研究。从而在较大程度上提升实际系统的性能,本论文的主要工作及创新点如下:首先,我们着眼于“话者模型训练”这一关键技术进行了较深入的研究:我们首先搭建了一个基于混合高斯超向量-支持向量机(GSV-SVM)的话者确认原型系统,接着对该原型系统的各模块进行了分析和改进。通过大量实验和分析发现SVM应用在话者确认建模时的正负样本非平衡问题严重降低了系统性能。为了解决非平衡问题,我们接着在本文中提出了两种方法:基于话者模型距离的度量方法(SMD)和支持向量重训练方法(SVRT)。SMD通过计算目标与冒认话者之间的模型间距离远近来判断两者之间的相似度,从而选择相似度大的冒认话者数据来做SVM负例样本。而后者则是在保持目标话者数据始终不变的情况下,直接使用SVM的区分特性,从海量数据中选择出最具代表的支持向量(SV)作为最后目标话者模型训练时的负例。这两种算法都在一定程度上解决了非平衡问题,从而达到提高性能的目标。其次,本论文在GSV-SVM系统框架基础上,针对复杂环境下的信道干扰问题,对现有扰动属性投影算法(NAP)做了几个方面的改进,提出了一种话路变化主成分分析算法(SVPCA-WCCN)。该算法在训练信道空间时,不仅利用了训练数据已知的信道类型标识信息,而且还考虑到在训练过程中增大不同话者模型之间的区分性,使得数据集合中已知的话者标识信息也得到了充分利用。该算法同时还起到了降维的作用。最终结合类内协方差归一化技术,对经过在信道干扰消除后的说话人空间进行投影后的特征向量进行平滑,从而进一步消除训练和测试之间的不匹配因素,得到鲁棒的目标话者模型。本算法在NIST数据库上的各种实验中都取得了较好的结果。第三,高层韵律特征参数因为其特征提取具有一定的难度而使其发展举步维艰。然而,这些特征的确具有良好的稳定性,不易受信道及噪声的影响,而且还能反映说话者的说话风格、习惯等具有良好区分性的个性特征。为了挖掘存在于高层韵律特征中的话者身份信息来进一步增强已经较成熟的基于底层声学特征参数的话者确认系统的性能,本文提出了一种采用韵律特征的话者确认方法:我们先介绍了韵律特征参数提取的若干细节,接着给出了话者确认系统的整个框架,最后给出了韵律特征在实际应用中需要用到的关键技术-分段加权融合算法(SWF)。在NIST数据库上的实验结果验证了韵律特征和声学参数特征的互补性,系统融合后可以较大地提升性能。该研究同时在话者确认的三大关键技术“特征提取、模型训练、得分融合”中都体现出了其贡献,从整个系统级的角度对基于韵律特征的话者确认系统做了全面的定位和分析。最后,本文针对话者确认中最本质的关键技术-“特征提取”进行了深入的思考,提出了一种全新的声纹特征,即基于谐波噪声模型HNM分解的频谱子带能量比特征参数(SSERs)。接着在SSERs特征的基础上进行了进一步深入的研究,提出了谐波子带能量和噪声子带能量特征。为了进一步完善新特征参数的提取方法,我们还提出了一种结合能量VAD和基音同步清浊音判断的后处理方法来更好的挖掘原始语音中存在的话者身份信息。我们首先将语音信号帧采用HNM进行分解,得到谐波和噪声两个成分,通过观察和分析语音信号帧在谐波和噪声部分频谱中每个频率子带的能量发现,即使是不同的两个目标话者在发同一个音的时候,这种子带能量的统计特性都能较好的反映他们之间的话者身份差异。为了突出所提特征的作用,我们排除其他因素的干扰,选择在干净环境下录制的中文863数据库进行验证实验。目前的结果表明,基于子带能量的一系列新特征参数已经能够在性能上超过传统的基于声学倒谱参数的特征,这为突破传统说话人识别中前端特征参数提取的深入研究奠定了一定的基础。
其他文献
高校家庭经济困难学生群体多年来一直是社会普遍关注的热点,贫困生资助体系建设已成为高校学生工作的重要组成部分,直接影响着高校的稳定和社会和谐发展的大局。本文以中南大
民以食为天,人民对于健康的关注程度越来越重视,对于日常生活供需品的关注度与日俱增。蔬菜是居民生活中必备的食物,河北省昌黎县农产品质量安全监督检验中心对于全县范围内
在陇东黄土高原区进行了紫苏“3414”肥效试验,结果表明,该地区土壤中有效养分含量表现为高K、中P、中N,N是限制产量的主要因子,N、P、K三要素对产量的效应由大到小为N、P、K。紫
体育运动中科学补水影响着人体水平衡、新陈代谢、人体温度与人体组织器官,科学补水需把握好补水时机、补水容量与补水类型,同时注意不补充生水,做到浓淡冷热相宜,区分水和饮
基于应用型人才培养的需求,地方高校必须改变传统的人才培养模式,针对当前实验教学中存在的问题,不断进行教学改革,研究生物学创新型人才的培养规律,深化实验教学课程体系的建设,建立问题导向、能力本位、实践创新的理念,将生物学实验课程体系进行整合与优化,构建基础-综合型实验、开放提高型实验和创新实验三大部分组成的实验创新平台体系,完善和加强各实验教学平台质量,促进生物学实验教学质量的快速提升。
<正>1背景信息美国食品安全新闻网(Food Safety News)近期报道,美国FDA发布了关于谷物中砷含量的调查报告。报告显示,在美国市场上售卖的大米中,印度香米和巴基斯坦的寿司米
企业必须承担一定的社会责任已经成为共识。而对于企业来说,必须把社会责任纳入到它的使命、目标和战略,并作为重要的管理实践。企业应该树立“以人为本”的经营理念和核心价值
随着中药在临床应用的普及,中药的发展已开启了世界化进程,与此同时,近几年中药重金属残留超标事件频频发生,中药重金属污染问题也引起了世界各国的广泛关注。中药重金属污染