基于K-L散度模型聚类的快速说话人辨识方法

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:lijiazhivvv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在网络应用环境下,需要处理的音频数据和注册说话人急剧增加,传统说话人辨识方法难以满足实时性要求.文中提出采用K-L散度的说话人模型聚类方法,从而构造一个分级辨识模型,提高辨识效率.研究利用类辨识信息估计置信度的方法,可尽早有效排除集外说话人.实验结果显示,文中方法可使辨识速度平均提高3.2倍,而闭集辨识错误率平均只有0.9%的增加.采用类辨识置信度进一步提高开集辨识速度,并且在保持集内错误率不变的情况下,使集外错误率相对下降5.1%. In the network application environment, the audio data and the registered speaker who need to be processed are increased sharply, and the traditional speaker recognition method can not meet the real-time requirement.In this paper, we propose a speaker classification clustering method using KL divergence to construct a hierarchical identification model, Improve recognition efficiency.Experimental results show that the proposed method can increase the recognition speed by an average of 3.2 times and the recognition rate of closed-set recognition average only 0.9% The class recognition confidence is used to further improve the speed of open set recognition, and the error rate outside the set is decreased by 5.1% while keeping the error rate unchanged.
其他文献
患者 ,女 ,2 4岁。于 19997年 8月 3日因“臀位 ,胎膜早破”急诊在持续性硬膜外麻醉下行子宫下段剖宫产术 ,手术顺利、麻醉满意、血压平稳 ,术后一般情况好 ,子宫收缩好 ,阴
快速准确预测排卵是不孕症治疗中亟待解决的问题 ,在生殖医学中有广泛的应用价值。目前用于监测排卵的主要方法有 :1观察激素的生物活性 :基础体温测定 (BBT) ,宫颈粘液评分
期刊
针对施工时大断面巷道煤柱帮易发生片帮的现状,为探索帮体失稳的力学机制,基于弹性力学理论,分析垂直静压环境下煤柱帮受水平开挖扰动时的应力场分布规律,得到煤帮的应力解析
期刊
因腹膜外剖宫产术不在腹腔内操作 ,术后肠蠕动恢复快 ,腹痛较子宫下段剖宫产轻 ,术后近期合并症及远期后遗症少 ,但因腹膜外剖宫产术对子宫下段暴露不充分 ,子宫切口相对小 ,
听力是一项重要的语言技能。是语言信息获取的重要手段,是语言学习的必备条件,但由于语言环境、母语干扰、教程安排等原因,英语的听说能力严重滞后英语读和写,因此培养学生的
根据病案提供的资料 ,患者阴道出血的可能原因是 :产道裂伤。分析如下 :患者为 G4P1孕 40 + 2 周 ,巨大儿 ,经阴道置米索试产 ,宫口开大 6 cm,因枕横位滞产 ,急诊行子宫下段
米非司酮用于促宫颈成熟的临床效果好,对母体的安全性较高.但是,用药对胎盘的结构有一定的影响,对胎盘合成的激素和调节因子亦可能有影响.目前,尚未见对胎儿、新生儿有影响的
钟南山,出生于1936年。系中国工程院院士、教授、博士生导师。1984年被授予首批国家级有突出贡献专家称号。1985年后被指定为中央领导保健医生,是中国治疗呼吸系统疾病的领军人物,抗击非典先进人物。  现在大家都在讲幸福。什么是幸福?我认为健康就是幸福!有了健康并不等于有了一切,没有健康就等于没有了一切。健康就是一个空心的玻璃球,掉下去以后就碎了。而我们的工作就是一个皮球,掉下去以后还可以弹起来。