用说话人相似度i-vector的非负值矩阵分解说话人聚类

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于贝叶斯或者全贝叶斯准则的说话人自动聚类或者识别方法,主要采取重复换算全发话语音段的相似量度,再组合相似性较大的语音片段实现说话人的聚类。这种方法中如果发话语音片段数越多,组合计算时间就越长,系统实时性变差,而且各说话人模型用GMM方法建立,发话语音时间短暂时GMM的信赖性降低,最终影响说话人聚类精度。针对上述问题,提出引用i-vector说话人相似度的非负值矩阵分解的高精度快速说话人聚类方法。 Based on the Bayesian or Bayesian criteria, the speaker automatic clustering or recognition method mainly adopts the repeated measure of the whole speech segment of speech similarity measure, and then combines the similar speech segments to realize the speaker clustering. In this method, if the number of voiced speech segments is longer, the combination calculation time is longer and the system real-time performance is worsened, and each speaker model is established by the GMM method, the reliability of the GMM is reduced when the speech voice time is short, and finally the speaker Clustering accuracy. In order to solve the above problems, a high-precision fast speaker clustering method based on non-negative matrix factorization of i-vector speaker similarity is proposed.
其他文献
近年来,经济高速发展的同时,也为建筑行业注入了新鲜血液.在我国不断加快城镇化建设步伐的不后,建筑行业更是带来了前所末有的发展机遇.传统的工程管理及施工质量控制已经越
高职会计专业实践教学的总体设计指导思想是提高学生的专业技术能力和解决实际问题的能力,具体设计思路是加强课堂职业技能演示教学,充分利用课程能力模块实训和能力综合实训
职业技能大赛是我国职业教育制度的一项重大创新。本文从学生、教师和学校三个层面论述了职业技能大赛对高职教育发展的有利影响。同时,职业技能大赛也给高职教育发展带来了
文章是对英语读后续写的指导.作者从越剧经典选段《桑园访妻》的赏析和转换入手,引出了文学作品必备的要素,并从人物,事件,场景,线索,冲突,动作,情感等角度开展对英语读后续
语言是教育交往的重要方式,教育互动中的多极主体通过有效的交往对话机制,沟通情感,建构知识,接受教育。哈贝马斯的交往行为理论对于大学教育中必要控制手段的运用,提供了较好的借
鲁迅在文章一开始就让祥林嫂死去,这样就使文章全篇带有一种逼问祥林搜死因的锐利.应该说导致祥林嫂悲剧命运的因素有很多,可能是祥林嫂自己,也可能是鲁四老爷、四婶或柳妈,
创新性学习的关键是优化课堂教学机制,要更新教育观念,实现教学方法的转变;倡导问题探究,引导学生自主性创新;开拓第二课堂,延伸教学渠道和资源,多给学生自主表现和自主发展
期刊
化学基础理论职业技术教学,应从自身教学特点出发,通过加强课前预习、有针对性讲授、归纳总结、求解习题等方面,积极实施教学改革,培养和提高学生的自学能力,增强知识向素质
对茶树菇(Agrocybe cylindracea)液体摇瓶培养的碳氮源、接种量、装液量以及培养时间进行了研究,筛选出了茶树菇液体培养的适宜条件。尝试将外源植物激素应用于茶树菇液体培