基于注意力的图像视觉关系识别研究

来源 :中国传媒大学学报(自然科学版) | 被引量 : 0次 | 上传用户:DeadManWalk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像关系是对图像中物体之间关系的识别,是理解图像的基础和关键。本文受注意力模型启发,提出一种端到端的图像视觉关系识别算法,该算法能够基于场景识别图像中的主要物体及它们之间的关系,提高了算法的运行效率。为了对算法进行验证,我们在MSCOCO数据集上进行了实验,实验结果表明我们的方法是有效的。
其他文献
二阶非线性光学(nonlinear optics,NLO)材料在电光调制和激光倍频等光电子领域均具有重要应用。无机-有机杂化材料兼具有机组分和无机组分的优点,具有较高的NLO系数以及良好
身体意象是个体对自己整个身体的心理形象,包括身体知觉和身体概念,它包括认知、评估和行为意向三部分。本文将从理论研究、临床研究和干预技术等方面简单介绍近年来对身体意
众所周知,一篇好的学术论文应具备科学性、先进性、实用性,这仅仅是必要条件,如果同时具备文理清晰、结构缜密、表达简明准确等可读性,这才是高质量学术论文的充要条件.医学
<正>西双版纳的美,早已被人们说千道万。此"美"不仅能予人以观感之悦,更能赠人以心境上的舒适,此美如同一幅印象派的彩色油画,第一眼看见它的绚丽,然后是梦幻,每一个层次上的
活塞的往复运动使活塞-缸套间产生摩擦磨损,从而使活塞-缸套间隙的过大。过大的活塞-缸套间隙影响到活塞敲击的振动特性,影响发动机正常工作。所以研究活塞-缸套间的摩擦磨损
目前,我国翻译市场不断壮大,翻译需求急剧增加,计算机辅助翻译因具有高效、质优的特点,越来越受到翻译服务机构的青睐。高校也纷纷开设计算机辅助翻译课程,以培养掌握翻译技术的人
通过ABAQUS建立了有限元三维分析模型,对某车灯用振动夹具进行了固有频率和振动模态分析,并对夹具进行了结构优化设计,使夹具的一阶固有频率远离激励信号的频率,并将优化前的
目的:探讨消坚排石汤中西医结合治疗复杂性肾结石的临床疗效。方法:将75例患者随机分为治疗组45例,对照组30例。治疗组予常规西医治疗加消坚排石汤,对照组仅予常规西医疗法。
在前人基础上综述了吸附法、生物法和高级氧化法对PAEs去除的研究,高级氧化法较其他两种方法显示出更高的效率,最后,对于目前的研究不足和未来的研究方向提出展望。
光镜和电镜观察表明,禾顶囊壳小麦变种对小麦种子根的侵染过程可分为侵入前、侵入表皮层、进入皮层和进入中柱等4个连续阶段。麦根接菌后在15℃下培养,48h后侵入表皮层细胞,60h后进入皮层