【摘 要】
:
视觉语言导航是涉及视觉信息和语言信息的复杂多模态任务,导航智能体遵循语言指令引导,在视觉环境中移动,以到达指定目的地。视觉语言导航可以帮助机器人实现许多有价值的应用,如“室内家务”、“自动物流”及“消防救援”等。现有基于Transformer的视觉语言导航方法显著地提升可见环境的性能表现,但仍然存在不可见环境泛化表现不佳的问题。本文聚焦于提升导航智能体在不可见环境的泛化能力,对视觉语言导航方法展开
论文部分内容阅读
视觉语言导航是涉及视觉信息和语言信息的复杂多模态任务,导航智能体遵循语言指令引导,在视觉环境中移动,以到达指定目的地。视觉语言导航可以帮助机器人实现许多有价值的应用,如“室内家务”、“自动物流”及“消防救援”等。现有基于Transformer的视觉语言导航方法显著地提升可见环境的性能表现,但仍然存在不可见环境泛化表现不佳的问题。本文聚焦于提升导航智能体在不可见环境的泛化能力,对视觉语言导航方法展开研究,主要从策略网络架构和奖励设计机制两个角度对导航智能体模型进行改进,具体研究内容主要有以下几点:1.基于因果注意力的视觉语言对齐针对数据偏差误导模型学习虚假相关性、削弱泛化能力的问题,提出基于因果注意力的视觉语言对齐方法。该方法包括1)视觉语言对齐子网络。通过因果注意力Transformer单元,挖掘环境全景视觉和自然语言指令与导航动作之间的因果关系,推理符合因果效应的导航动作,提升模型的泛化能力。2)门控更新子网络。通过门控机制筛选关键时刻信息,为导航决策提供历史信息。该方法在公开数据集R2R和仿真平台Mattport3D上测试验证,与现有的基线模型相比,可见环境的准确率SR提升2.15%,不可见环境的准确率提升2.07%。2.基于自监督辅助任务的内在奖励生成针对视觉语言导航任务中环境反馈奖励模糊、无法为视觉语言对齐提供有效的监督信息的问题,提出基于自监督辅助任务的内在奖励生成方法。通过构造三种适用于Transformer为策略网络的自监督辅助任务,促进模型自发地归纳环境语义信息和导航决策机理,生成不依赖外部监督标签的内在奖励,为智能体提供额外训练信号,提升模型的学习速率和泛化能力。相较于现有基线模型,该方法在公开数据集R2R上可见环境和不可见环境的准确率SR分别提升5.58%和1.28%。3.室内视觉语言导航系统针对现实场景对于视觉语言导航的应用需求,设计系统总体架构和相关功能模块,结合Vue、Flask、Pymysql等开发框架,构建室内视觉语言导航系统。并调用本文提出的两种视觉语言导航方法实现导航功能。
其他文献
为了比较1%小苏打溶液浸泡加冲洗、目前市面主流的电解水技术原理便携式果蔬清洗机和普通清水冲洗方法对农药残留的去除效果,本研究采用气相色谱法和高效液相色谱法分别测定经3种不同清洗方式处理后果菜和叶菜类蔬菜中克百威和腐霉利2种农药的残留量,分析并比较农药去除效果。试验结果表明,清水冲洗、1%小苏打溶液浸泡加冲洗和便携式果蔬清洗机清洗对蔬菜中2种农药的平均去除率分别是45.00%、41.34%和50.9
魏晋南北朝是我国文化发展的重要时期,受政治因素的影响,当时的社会环境背景相对宽松,形成了百花齐放的特征,尤其是道家思想文化占主流地位,涌现出大量具有较高影响力的文人志士,对后世文坛产生深远的影响,本文结合魏晋南北朝发展历史,研究魏晋南北朝思想文化发展背景,指出魏晋南北朝文学总体特征及在中国文学史上的地位和作用。
近年来,培养学生朗读能力的新课题研究不断取得新的突破,特别是小学阶段的阅读教学研究更是进行得如火如荼,学生朗读能力的培养已逐渐成了业内人士关注的重点内容。这种情况要求小学语文教师对阅读教学中存在的不足进行整改,不再过多重视对阅读内容的分析,可指导学生大声朗读文章,争取把大声朗读的作用发挥出来。本文根据实际工作中积累的经验,就提高学生的朗读能力提出几点策略。
为了直接识别出污泥中的聚磷细菌和其种属,本研究采用4’,6-二脒基-2-苯基吲哚(DAPI)染色和流式细胞荧光分选技术(FACS)对以淀粉为唯一碳源的缺氧/好氧序批式活性污泥(SBR)系统(R1)的缺氧末期和好氧末期以及以乙酸盐为唯一碳源的厌氧/好氧SBR系统(R2)的好氧末期污泥的聚磷细菌进行了原位分选,并通过16S rRNA高通量测序技术鉴定了分选后细菌的种属.结果表明,在R1中,缺氧期和好氧
少先队仪式教育活动是少先队改革的重要抓手之一。课题组发现仪式的内容、形式和队员的参与三大方面,是少先队仪式活动面临的突出困境。课题组在广泛调研基础上,结合专家的意见和辅导员、队员的和需求,总结梳理出初中少先队仪式教育的活动设计"四步曲",即:确立活动目标——创设情境场域——开展研学活动——架构实施框架。并且通过优化师资培训、试点学校探索、形成学校特色的实践路径,在区域层面实施推进,从而到达通过少先
以乙酸锌为锌原,通过水热法制备了纳米ZnO颗粒,通过XRD、SEM、FT-IR等分析了样品的晶格结构、微观形貌和光谱特性。采用序批式活性污泥工艺(SBR),研究了纳米ZnO颗粒对活性污泥硝化作用的影响。结果表明,合成出的纳米ZnO颗粒为标准的纤锌矿结构,具有较高的结晶度,分散性较好,呈现颗粒状,粒径尺寸在25~45 nm之间;随着纳米ZnO颗粒添加量的增加,SBR溶液中的Zn2+浓度逐渐上升,活性
美妙的诗歌,是中国古代文化艺术宝库中不可缺少的一部分。而优美的语言、诗境表现出诗歌独特的艺术审美价值,因此,在初中诗歌教学中,教师要采取积极有效的教学手段,让学生在阅读鉴赏诗歌的过程中,清楚地理解和掌握诗歌的形象美、绘画美、感情美,从而提升学生的诗歌鉴赏能力和语文核心素养。
<正>美育又被称为审美教育,它是通过培养人们认识美、体验美、感受美、欣赏美和创造美的能力,从而使人们具有美的理想、美的情操、美的品格和美的素养。语文诗歌教学是有效的审美教育途径,在诗歌教学中,发掘美育的价值,对推动学生形成高尚的审美品位和审美情趣具有重要意义。