基于长短时预测一致性的大规模视频语义识别算法

来源 :中国科学:信息科学 | 被引量 : 0次 | 上传用户:zdb_zhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
片段视频语义识别旨在识别视频中短小片段的语义概念,是视频分析的一项重要任务.由于片段视频的数量巨大且缺乏可参考的网络标签,片段视频的标记十分困难,通常只能对部分片段视频进行标记.如何利用有限的语义标签提高片段视频语义识别的准确率是一项关键挑战.因此本文提出了一种基于长短时预测一致性的视频语义识别算法.该算法通过引入完整视频语义与片段视频语义一致性的约束,对片段视频语义识别结果进行筛选,以此提高片段视频语义识别的准确率.本文提出的算法在大规模视频数据集YouTube-8M的片段视频语义识别任务上达到了
其他文献
在全面从严治党和依法治国的大背景下,纪检监察信访举报的积极作用得到充分显现,也随之产生了新的挑战。尤其在监察体制改革后,纪检监察机关的监督对象涵盖了所有行使公权力的公职人员,就国有企业而言,即使没有领导职务的一般管理人员也在监督范围之内,自然带来了信访举报的激增。笔者认为,在新的历史条件下,国有企业的纪检、工会等各部门应互补优势,既要加强风险研判和源头治理,努力将矛盾纠纷化解在萌芽,又要重视引导职
期刊
近年来,如何有效的加强行政事业单位财政专项资金审计以及后期的及时控制越发受到全社会的广泛关注。审计机构领导层以及现场审计人员需深入研究审计风险发生的成因,不断提高审计风险防范意识,避免审计风险的发生以达到审计积极健康发展的目的。然而在现场的实行过程中,行政事业单位审计风险的发生因素非常多,需要根据审计行为的具体情况作出判断。
期刊
新冠疫情防控期间,沁源县纪委监委组织开展了"清风读书会"活动,不断推动全体纪检监察干部在思想淬炼、政治历练、实践锻炼、专业训练上取得新进展。"五个结合"开启读书新模式。纪检监察干部将网络学习平台充分利用起来,综合采取线上学习与线下学习相结合、长期学习与短期学习相结合、八小时之内与八小时之外相结合、规定篇目与自选篇目相结合、视频学习与研讨交流相结合的办法,不断拓展学习渠道和载体,用书香充盈起大家的精
期刊
按照省人大常委会党组"不忘初心、牢记使命"主题教育工作安排,7月26日上午常委会秘书长、机关党组书记常晓春带领省人大常委会机关党员干部来到吉林省廉政教育基地,集体观看了"党风廉政建设和反腐败斗争永远在路上"主题展览并观看了警示教育专题片。
期刊
随着人工智能(artificial intelligence, AI)等新技术的引入,给光通信带来了新的活力,赋予了新的含义,形成了新的体系,构建了新的业态,受到来自学术界和工业界持续而广泛的关注与极大的研究热情.特别是将AI与已有光通信系统与网络中的光信号处理等技术相结合,可为宽带光接入、高速光传输、灵活光交换、智能光联网等性能提升和网络优化提供高效的解决方案.然而, AI在光通信中的研究与应用
期刊
集成特征选择算法将多种特征选择方法结果结合在一起,旨在得到更加有效的特征子集.然而这些算法通常假设每种特征选择方法是平等的,没有考虑不同特征选择方法性能的差异性,导致少数方法选择出的有效特征被忽略.为解决这一问题,本文提出一种可以有效地结合不同特征选择方法优势,并利用专家的知识逐步改善所选特征的交互式特征选择方法.该方法包括一个基于众包学习的集成特征选择算法和一个基于该算法开发的可视分析系统.基于
期刊
在基于深度网络的自然语言处理任务中,嵌入表示层用词向量刻画词的语义信息,可以有效地提升模型性能.词向量可以和当前任务一起端到端地进行学习,但是从模型参数数量的角度来看,词向量的训练很容易在小语料库上过拟合.为了解决这个问题,通常会使用在大语料库上预训练得到的词向量.首先,本文总结了几种常见的复用预训练词向量的方法.其次,由于当前任务的变化,会有一些新词出现,这些新词的词向量不能通过预训练的词向量获
期刊
识别海量变量间潜在的复杂关联关系,判断不同形式关联关系的强弱,是大数据关联关系挖掘的重要任务之一.然而,数据分布的不确定性、关联关系的多样性,使得基于分布假设的关联关系度量和基于数据驱动的非参数度量方法的适用性、准确性难以保证.因此,设计一种对关联关系形式无偏的有效关联度量方法变得至关重要.本文从大数据背景下潜在关联关系应被公平排序的需求出发,回顾了目前关联度量的公理化条件,给出了大数据关联关系度
期刊
随着万维网的发展,知识图谱数据大量增长,并在面向智能应用的研究中受到广泛关注.知识图谱用RDF (resource description framework)三元组描述实体相关的事实.在知识图谱中,关于一个实体的描述可能包含大量三元组,在一些需要直接呈现实体信息的应用中,为了避免用户信息过载,并适应有限的呈现空间,就需要进行实体摘要.实体摘要任务是从实体描述的众多三元组中选出最有代表性的子集作为
期刊
近年来,视频数据资源的日益丰富催生了一系列对于视频片段精细检索的需求.在这样的背景下,对于跨模态视频片段检索的研究逐渐兴起,其旨在根据输入的查询文本,输出一段视频中符合文本描述的片段.现有的研究工作主要关注于查询文本与视频片段的全局或局部的特征表达,而忽略了查询文本与视频片段中所蕴含的语义关系在跨模态检索中的匹配.例如,给定查询文本"一个人在打篮球"时,现有检索系统将根据整个查询文本和的视频的特征
期刊