【摘 要】
:
针对输入的图像视觉信息不能在每一步解码过程中动态调整,同时为了提高图像语义描述模型的精度和泛化能力,提出了一种结合引导解码和视觉注意力机制的双层长短时记忆(long sh
【机 构】
:
重庆邮电大学光电信息感测与传输技术重庆市重点实验室
【基金项目】
:
国家自然科学基金资助项目(61471075,61671091);重庆科委自然科学基金资助项目(cstc2016jcyjA0347);重庆高校创新团队建设计划
论文部分内容阅读
针对输入的图像视觉信息不能在每一步解码过程中动态调整,同时为了提高图像语义描述模型的精度和泛化能力,提出了一种结合引导解码和视觉注意力机制的双层长短时记忆(long short term memory,LSTM)网络的图像语义描述模型。将提取到的图像的视觉和目标特征通过一个引导网络建模后送入LSTM网络的每一时刻,实现端到端的训练过程;同时设计了基于图像通道特征的视觉注意力机制,提高了模型对图像细节部分的描述。利用MSCOCO和Flickr30k数据集对模型进行了训练和测试,结果显示模型性能在不同的评价指
其他文献
中间体专利技术栏目介绍的是最新中间体专利信息 ,其内容大多选自近期出版的美国化学文摘 (CA)等文献 ,如需专利原文者 ,请与编辑部联系。电话 :0 1 0 6 4 4 4 4 0 32 835E
中文结缕草属(Zoysia)植物具有优良的环境适应性和观赏价值,既可用于建植高质量运动场草坪,又可用于绿化、护坡,适宜粗放管理,在我国广泛种植。种子建植结缕草草坪播种期与夏
基于ANSYS软件,建立冷凝器模型,采用了静力学和动态分析法,对冷凝器抗冲击能力进行了X,Y,Z 3个方向的仿真。分析计算出设备受X,Y,Z 3个方向冲击时的应力响应结果,为该型设备
总线系统是飞机的重要组成部分,作为飞机的"神经系统",总线系统的重要作用是担负信号的输送和分配的任务。总线物理层特性对总线的传输性能具有重要影响,建立合适的物理层模
功能性失音是癔病的一种,本病近年来发病率有逐渐上升的趋势,其病程长短不一,部分患者可自愈,部分患者未经及时治疗,严重时可影响患者情绪及日常生活工作。陈俊军教授从事针
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
为了预测生物组织低温保存过程中所受到的机械损伤,建立了一维球对称模型,模拟计算了降温过程相变界面随时间的移动,壁面温度随时间的变化;组织内温度分布不匀引起的热应力随时间
近些年,随着互联网金融的蓬勃发展,不仅为我们的日常生活带来了便利,同时互联网金融也给我们带来了信用风险,如,支付宝、微信支付潜在的信用风险等。人们应该通过一些具体的
政协协商是实现党的领导的重要方式、践行群众路线的重要途径、基层社会治理的重要形式。武汉市武昌区委高度重视,切实加强对政协协商工作的领导,专题研究协商计划,定期听取
2004年9月14日至17日,在韩国大田召开了第二届亚洲太平洋计量会议和压力与真空研讨会.会议主办单位是韩国标准科学研究院(KRISS),有来自8个国家的近30名代表参加了会议,我们