基于多维度和多模态信息的视频描述方法

来源 :通信学报 | 被引量 : 4次 | 上传用户:khsim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对视频自动描述任务中的复杂信息表征问题,提出一种多维度和多模态视觉特征的提取和融合方法。首先通过迁移学习提取视频序列的静态和动态等多维度特征,并采用图像描述算法提取视频关键帧的语义信息,完成视频信息的特征表征;然后采用多层长短期记忆网络融合多维度和多模态信息,最终生成视频内容的语言描述。实验仿真表明,所提方法与目前已有方法相比,在视频自动描述任务中取得了较好的效果。
其他文献
结合突发疫情对旅游上市企业造成的财务影响,从收入、现金流、年报审计、商誉减值等方面进行分析,结合政府监管、企业自救提出了针对性的策略建议,以实现促进旅游上市企业健
采用荧光染色技术研究山羊瘤胃中原虫对细菌的吞噬速率。试验设置精粗比分别为10:90和50:50的A、B两组,结果表明:吞噬速率A组、B组分别为106.2、184.2cells/(cell·h),换算为细菌N
近年来,互联网涉及的领域越来越广泛,在互联网金融市场快速发展下,电商企业面临着很大的压力。电商的发展水平十分不稳定,很多电商企业存活率低,稍微有所忽视,其信誉和口碑就