基于K-L散度模型聚类的快速说话人辨识方法

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户：lijiazhivvv

【摘要】

：

在网络应用环境下,需要处理的音频数据和注册说话人急剧增加,传统说话人辨识方法难以满足实时性要求.文中提出采用K-L散度的说话人模型聚类方法,从而构造一个分级辨识模型,提

【作者】

：

王欢良韩纪庆郑贵滨

【机构】

：

哈尔滨工业大学计算机科学与技术学院,青岛科技大学信息科学与技术学院,

【出处】

：

模式识别与人工智能

【发表日期】

：

2010年06期

【关键词】

：

K-L散度模型聚类置信度说话人辨识网络环境

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在网络应用环境下,需要处理的音频数据和注册说话人急剧增加,传统说话人辨识方法难以满足实时性要求.文中提出采用K-L散度的说话人模型聚类方法,从而构造一个分级辨识模型,提高辨识效率.研究利用类辨识信息估计置信度的方法,可尽早有效排除集外说话人.实验结果显示,文中方法可使辨识速度平均提高3.2倍,而闭集辨识错误率平均只有0.9%的增加.采用类辨识置信度进一步提高开集辨识速度,并且在保持集内错误率不变的情况下,使集外错误率相对下降5.1%. In the network application environment, the audio data and the registered speaker who need to be processed are increased sharply, and the traditional speaker recognition method can not meet the real-time requirement.In this paper, we propose a speaker classification clustering method using KL divergence to construct a hierarchical identification model, Improve recognition efficiency.Experimental results show that the proposed method can increase the recognition speed by an average of 3.2 times and the recognition rate of closed-set recognition average only 0.9% The class recognition confidence is used to further improve the speed of open set recognition, and the error rate outside the set is decreased by 5.1% while keeping the error rate unchanged.

其他文献

产后自发性脑出血1例

患者 ,女 ,2 4岁。于 19997年 8月 3日因“臀位 ,胎膜早破”急诊在持续性硬膜外麻醉下行子宫下段剖宫产术 ,手术顺利、麻醉满意、血压平稳 ,术后一般情况好 ,子宫收缩好 ,阴

EIA定量监测尿LH预测排卵及其应用

快速准确预测排卵是不孕症治疗中亟待解决的问题 ,在生殖医学中有广泛的应用价值。目前用于监测排卵的主要方法有 :1观察激素的生物活性 :基础体温测定 (BBT) ,宫颈粘液评分

期刊

定量监测准确预测排卵基础体温测定应用价值激素含量宫颈粘液评分酶联免疫法黄体生成素超声波检测不孕症治疗主要方法生殖医学生物活性卵泡发育

值得适当考虑的职称评退问题

期刊

大断面巷道煤柱帮在开挖扰动下的应力场

针对施工时大断面巷道煤柱帮易发生片帮的现状,为探索帮体失稳的力学机制,基于弹性力学理论,分析垂直静压环境下煤柱帮受水平开挖扰动时的应力场分布规律,得到煤帮的应力解析

期刊

大断面巷道煤柱帮开挖扰动应力场

对我国沙滩排球市场化的现状分析

期刊

多点"⊥”形切开子宫腹膜外剖宫产36例分析

因腹膜外剖宫产术不在腹腔内操作 ,术后肠蠕动恢复快 ,腹痛较子宫下段剖宫产轻 ,术后近期合并症及远期后遗症少 ,但因腹膜外剖宫产术对子宫下段暴露不充分 ,子宫切口相对小 ,

期刊

多点子宫下段剖宫产腹膜外剖宫产术胎头娩出困难远期后遗症子宫切口术后腔内操作合并症动恢复后肠腹痛

英语听力对学习的影响因素和解决对策

听力是一项重要的语言技能。是语言信息获取的重要手段,是语言学习的必备条件,但由于语言环境、母语干扰、教程安排等原因,英语的听说能力严重滞后英语读和写,因此培养学生的

期刊

听力理解教学方法母语干扰语言学习听力技能听说能力影响因素学习过程辨音能力听力技巧

16卷3期疑难病案讨论选登

根据病案提供的资料 ,患者阴道出血的可能原因是 :产道裂伤。分析如下 :患者为 G4P1孕 40 + 2 周 ,巨大儿 ,经阴道置米索试产 ,宫口开大 6 cm,因枕横位滞产 ,急诊行子宫下段

期刊

阴道穹窿子宫切口子宫下段剖宫产术阴道出血枕横位胎头位置组织缺血压迫时间血管断裂胎儿破裂出血可能原因患者病理改变阴道壁血管丛巨大儿

米非司酮对胎盘结构、功能及胎儿的影响

米非司酮用于促宫颈成熟的临床效果好,对母体的安全性较高.但是,用药对胎盘的结构有一定的影响,对胎盘合成的激素和调节因子亦可能有影响.目前,尚未见对胎儿、新生儿有影响的

期刊

米非司酮胎盘围产期

最大的成功是健康的活着

钟南山，出生于1936年。系中国工程院院士、教授、博士生导师。1984年被授予首批国家级有突出贡献专家称号。1985年后被指定为中央领导保健医生，是中国治疗呼吸系统疾病的领军人物，抗击非典先进人物。　　现在大家都在讲幸福。什么是幸福？我认为健康就是幸福！有了健康并不等于有了一切，没有健康就等于没有了一切。健康就是一个空心的玻璃球，掉下去以后就碎了。而我们的工作就是一个皮球，掉下去以后还可以弹起来。

期刊

钟南山院士活着不等于像人生活习惯急性肝炎多动腿时觉三到

基于K-L散度模型聚类的快速说话人辨识方法

与本文相关的学术论文