增强视觉特征的视觉问答任务研究

来源 :中原工学院学报 | 被引量 : 1次 | 上传用户:awenqqw123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉问答是一种涉及计算机视觉和自然语言处理两大领域的学习任务。该任务融合视觉和语言的特征实现问答,是多模态研究的重要任务之一,已经成为人工智能领域的一个研究重点。通过对已有模型的分析,现有方法在进行图像特征表示时,仅仅只采用图像的网格特征、对象特征等整体视觉特征,而忽略了图像中对象本身以及不同对象之间的位置信息。提出在原有视觉特征的基础上,引入图像中每个对象的坐标信息,得到增强的视觉特征,使模型能够更加准确地学习图像中所蕴含的深层语义。在VQA-v2数据集上的对比实验证明,在图像特征中融入对象的坐标
其他文献
心脑血管疾病死亡居死因首位。流行病学统计与病理学研究均证明了气象、污染因子的变化与心脑血管疾病事件发生之间有密切的联系。基于成熟的气象、污染预报系统进行心脑血管
新时代,伴随我国高职教育的发展与完善,社会对高职院校金融管理专业的人才培养提出了新要求。本文以湖南网络职业学院为例,从专业人才培养方案顶层设计、专业对接社会产业和
燃料电池是一种将燃料和氧化剂的化学能不经燃烧直接转化为电能的发电装置。直接甲醇燃料电池(DMFC)以甲醇为燃料,具有比能量密度高、结构简单、使用方便灵活等特点,在手机、笔
良好习惯的养成不是朝夕之事,是需要我们老师帮助幼儿不断巩固,让幼儿不断内化的过程。那怎样利用文学作品来培养幼儿良好的生活习惯呢?我觉得对症下药最重要。1.生动有趣的
为建立鸡可食性组织(皮脂、肌肉、肝脏、肾脏)中尼卡巴嗪的高效液相色谱(HPLC)检测方法,本研究采用乙腈提取组织样品中尼卡巴嗪,正己烷除脂;流动相为乙腈:超纯水(55:45,v/v);
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
为研究随机森林(Random Forest,简称RF)智能算法对于砂土地震液化预测判别模型的适用性,在综合考虑地震因素、土层埋藏情况、砂土特性的基础上,选取地震等级、埋深、上覆压力
全球化时代营造的激烈竞争环境给城市发展带来了机遇和挑战。为了吸引更多的全球资本,越来越多的地方政府将城市营销作为城市竞争战略的重要手段,但是由于对城市营销理论的认识
问句语义匹配旨在判定给定的两个语句的语义信息是否匹配,在信息检索、自动问答、机器翻译等领域应用广泛,是自然语言处理研究的一个关键问题。现有基于机器学习或深度学习的