【摘 要】
:
当前对视觉问答(Visual Question Answering,VQA)建模的研究多种多样,但现有的VQA模型有一个共同的缺点:训练和推理较为耗时。研究表明,VQA模型中文本处理部分主要基于长短期
【机 构】
:
中国科学院上海高等研究院,中国科学院大学
【基金项目】
:
国家自然科学基金(U1831118),中国科学院战略性先导科技专项(XDA19000000,XDA19090106),上海市科学技术委员会科研计划项目(18511103502)
论文部分内容阅读
当前对视觉问答(Visual Question Answering,VQA)建模的研究多种多样,但现有的VQA模型有一个共同的缺点:训练和推理较为耗时。研究表明,VQA模型中文本处理部分主要基于长短期记忆网络(Long Short Term Memory,LSTM),而VQA模型的整体性能也受制于文本处理部分的LSTM网络,由于LSTM网络具有循环的特性,LSTM网络中复杂的数据流难以有效利用GPU的并行计算优势来加速计算。针对以上问题,以优化模型的训练速度为目的,提出了一个新模型SCMP(Simple
其他文献
目的研究急性颅脑损伤患者血清标志物与预后的关系。方法100例急性颅脑损伤患者进入研究,记录年龄,GCS评分,瞳孔和头颅CT的Rotterdam评分;检测血清S100钙结合蛋白B(S100B),神
意见证据规则是规范证人证言的证据规则,是证据排除规则中的重要内容之一。如果在立法上合理规定意见证据规则,并在司法实践中使其得到符合原意的运用,那么这一规则对于完善我国
目的:探讨出院后延伸干预对失代偿期肝硬化患者的自我护理能力的影响进行分析,从而为临床实践提供依据。方法 选取我院 2018 年 1 月至 2019 年 12 月收 治的 92 例失代偿期
活动式课文的数量大幅增加是新版思想政治教科书的一大亮点。它秉承了“以学生的发展为本”的理念,从学生的生活实际出发,以其独特的方式把知识寓于活动之中,潜移默化的影响
商务汉语是在商务场合下使用的语言,既有商务活动的专业性特征,又有基础性对外汉语的普遍特征。中国经济和社会的发展使商务汉语的经济价值慢慢显现,学习者学习汉语的目的多
音乐仿佛有一种魔力,我们在聆听音乐的时候可以感受到旋律的美妙与动人,可以体会到歌词的深意与哲理,歌曲的不同,会给我们传递不同的讯息,从而增强我们的乐感,激发我们更多的
近年来,为推进现代渔业产业发展,广州市创新财政资金扶持方式,出台了一系列强渔惠渔政策,通过实施水产养殖政策性保险、"菜篮子"工程、农机购置补贴、鱼塘建设、池塘养殖水治
本文基于2003-2016年中国A股上市公司数据,从对外直接投资的速度、时间和经验三个维度全方位刻画企业的对外投资动态决策图景,分析企业对外投资影响企业创新的内部机理。研究
对平移的概念把握不准.选项A需要通过一次平移和一次旋转才能得到;选项C明显不可以;选项D需要4次平移才能得到.