【摘 要】
:
针对现有图像语义理解模型存在描述不充分以及视觉属性冗余的问题,提出了一种带有视觉三元组标签且能够挖掘潜在信息的图像语义理解模型VT-BLSTM。首先,使用卷积神经网络提取
【机 构】
:
上海理工大学光电信息与计算机工程学院,上海理工大学测试技术与信息工程研究所,上海市现代光学系统重点实验室(上海理工大学)
【基金项目】
:
国家自然科学基金(61701296);上海市自然科学基金(17ZR1443500)
论文部分内容阅读
针对现有图像语义理解模型存在描述不充分以及视觉属性冗余的问题,提出了一种带有视觉三元组标签且能够挖掘潜在信息的图像语义理解模型VT-BLSTM。首先,使用卷积神经网络提取图像的全局特征和视觉三元组标签;其次,构建双向长短期神经网络,并利用改进的双注意力模型分别获得动态视觉特征和动态文本特征,融合该两者特征得到视觉语义上下文;最后,融合视觉语义上下文、视觉三元组和神经网络隐含层特征,比较前向和后向长短期神经网络的输出结果,得到对应时刻的单词。在Flickr8K和Flickr30K数据集上的实验结果表明,本文
其他文献
<正>通过对十九大报告的认真研习,我深刻体会到教育培训工作不仅仅是我国教育事业的任务,也充分体现在各行各业的实践、发展历程中,只有不忘初心、加强员工教育培训,才能建设
通过中国传统文化的概念阐述从而了解其设计思想,在现代工业设计中如何通过设计形态来体现其传统文化的设计思想
<正>"三十个活泼可爱的你们组成了一个活力四射的集体。在这里,你们健康地成长着,尽情地展示着你们的活泼开朗、淘气与机灵,那一份纯真,那一种灵动……不知何时,你们已经悄悄
对于一个组织而言,企业文化建设是不可或缺的一部分,企业文化对于提高企业内部凝聚力、实现企业经营战略目标、提高企业市场竞争力有很大的促进作用。目前每年都有大量的新兴
<正>蝇贪之害,首在虐民。虐民则怨生,怨生则众叛,众叛则衅起,衅起则天下汹汹。所以说,怨不在大,所畏惟人,载舟覆舟,所宜深慎。既反巨腐,又防蝇贪,就是基于这个道理。遍览史书
在学前教育过程中,体育活动的有效开展对于孩子的健康发展至关重要,体育活动的有效设计与组织是体育活动顺利开展的关键。室内空间为体育活动的开展开拓了新环境,通过分析体
研制了空气式有载分接开关在线多点温度监测超温报警装置 ,其特点是 :采用红外线传输信息的多机通信方案 ,特定的温度传感器 ,软、硬件系统和独立电源。试验结果证实 ,装置具
近年来,随着职业教育的蓬勃发展,职业教育教学改革也相应受到各所职业院校的重视,与此同时,创客运动席卷全球,当创客精神与教育相遇,创客教育便应运而生。创客教育秉承了“创
校园文化是指学校在长期的办学过程中、学校全体成员在一系列的教育活动中,以校园为载体,旨在提高全校师生精神文化底蕴、促进全校师生身心健康发展,经过学校全体成员共同创
以CRH1型和CRH3型动车组的两种典型火灾报警系统为实例,对其系统架构、性能及应对措施进行了比较。
Taking two typical fire alarm systems of CRH1 and CRH3 type EMUs as