基于跨模态的无监督影视剧说话人识别

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:Cecil1119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,影视剧的海量增长给其有效管理带来了巨大挑战,而其中的角色识别在影视剧内容管理中具有重大意义。传统的角色识别主要采用依赖于训练样本质量的有监督学习,而现实中一般难以获得充足的训练样本。针对影视剧中的角色识别,提出一种跨模态的无监督说话人识别方法:首先基于声学特征和时间近邻性的音频聚类获得对应聚类结果的音频标记序列;然后通过剧本解析获得对应说话人、说话内容、说话时间的文本标记序列;接着将音频序列与文本序列进行跨模态序列匹配,构造满射解出最小编辑距离,从而实现说话人识别。实验结果表明,在训练集较少的情况
其他文献
【正】 近年来,随着政治、经济和社会全面危机的不断加深,人才流失问题逐渐成为俄罗斯迫切需要解决的一个社会问题。根据一些报刊提供的一系列“最新的确切资料”,可以看出俄
职工素质技能的提升,是一个循序渐进的过程,是一项浩大的系统工程。企业在市场中的竞争归根结底是人才和职工队伍的竞争,这不仅影响到企业的技术改造,而且影响着企业的综合竞争力
ISO9000 质量管理体系标准自1987 年问世以来, 因其在质量管理理论方面的先进性、面向对象的广泛适用性、标准体系的严谨性和认证审核的公正性,满足了企业对质量管理的需要,
期刊
本刊讯全球领先的闪存存储解决方案供应商闪迪公司3月18日在京宣布推出一款专为IT行业开创全新类别的革命性全闪存存储平台,IDC将其称为“大数据闪存”,即闪迪IfiniFlash存储系
人口素质和物质基础是相辅相成的,两者相互促进,如果人口素质不能与物质基础设施相适应的话,这些基础设施就如同堆积在一起的钢铁、水泥,很难发挥出应有的作用。甘肃的现代化建设
大学生村官期满后何去何从,是困扰现任以及准备成为大学生村官群体的最大顾虑。因此,了解当前大学生村官再就业的现状,认清大学生期满后的可能方向,将有助于稳定当前大学生就业心
长期以来,片面强调纳税人的义务,忽视其权利的观念在大众心中根深蒂固,然而近年来随着公民权利意识的觉醒,纳税人的权利保护问题逐渐得到普遍关注和重视。拟从纳税人权利的内
【正】 波兰的教会并非单纯的宗教现象,实质上是一股强大的政治势力。这是一个引人思索、值得深入探讨的课题。波兰国内究竟有多少人信教,很难说出一个十分准确的数字。不过
【正】 自1986年苏共召开第二十七次代表大会以后,苏联加快了体制改革的步伐,无论在政治生活还是在经济建设中特别强调发扬社会主义民主,而其中最重要的一个内容就是通过民主