基于聚类网络的文本-视频特征学习

来源 :计算机科学 | 被引量 : 0次 | 上传用户:hq520cyj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
综合理解视频内容和文本语义在很多领域都有着广泛的研究。早期的研究主要是将文本-视频映射到一个公共向量空间,然而这种方法所面临的一个问题是大规模文本-视频数据集不足。由于视频数据存在较大的信息冗余,直接通过3D网络提取整个视频特征会使网络参数较多且实时性较差,不利于执行视频任务。为了解决上述问题,文中通过良好的聚类网络聚合视频局部特征,并可以同时利用图像和视频数据训练网络模型,有效地解决了视频模态缺失问题,同时对比了人脸模态对召回任务的影响。在聚类网络中加入了注意力机制,使得网络更加关注与文本语义强相
其他文献
以N-氯代丁二酰亚胺为氯源,在温和、简便的条件下实现了异腈的双氯化反应,合成了N-苯基二氯亚胺类化合物.通过研究溶剂、温度、时间、氯源种类及其用量等因素对反应的影响,获
目的系统评价金匮肾气丸加减干预高血压病的临床疗效与安全性。方法计算机检索中国知识资源总库(CNKI)、中国学术期刊数据库(万方数据)、中文科技期刊数据库(重庆维普)、Cochrane L
胫骨平台骨折是一种难治性关节内骨折,治疗不当容易引起不同程度的膝关节功能障碍,本文对我院骨科收治的胫骨平台骨折進行关节镜微创治疗,取得良好效果,现报道如下。 本文为全文原貌 未安装PDF浏览器用户请先下载安装 原
针对SIFT特征提取算法过程复杂且实时性低的缺陷,提出了一种基于GPU的实时尺度不变特征变换(Scale-inva-riant feature transform,SIFT)的优化算法——CUDA Optimized SIFT(CoSift)。该算法首先利用CUDA流并发构建SIFT尺度空间,在此过程中充分利用了CUDA存储器模型中的高速存储器来提高数据访问速度,并对二维高斯卷积核进行降维优化来减
目的探讨妊娠期甲状腺功能减退(甲减)对妊娠结局以及胎儿的影响。方法回顾分析42例妊娠合并甲减患者的临床资料,并选取同期42名正常妊娠妇女作为对照组。观察2组患者妊娠和新生
程序控制流的设计是为实现正确的数据流服务的,数据流测试是非常重要的。文中将面向all-uses数据流准则的测试用例生成问题建模为多目标优化问题,提出了一种基于遗传算法的测
GCC(GNU Compiler Collection)编译器编译C语言源程序所生成的抽象语法树文本中包含大量与源代码无关的冗余信息,若直接进行解析,会严重影响分析效率,降低分析精确度,同时会
云计算已成为各行业中十分重要的计算服务方式。传统的云计算研究主要侧重于云服务的定价方式、利润最大化、执行效率等服务质量,而绿色计算成为了近年来分布式计算的发展趋