【摘 要】
:
图像自动描述生成是一个结合了计算机视觉、自然语言处理的跨模态研究问题,它的目的是能够将图像中的内容转译为符合人类习惯的自然语句描述,可以看作是对图像信息进行描述的任务,它可以为视觉信息自动生成描述。近年来,通过卷积神经网络提取图片中词特征的主要趋势。当前大多数的Image Caption(即图像自动描述生成)方法基于二段式编解码模型即encoder-decoder结构。然而目前主流方法对于图像特征
论文部分内容阅读
图像自动描述生成是一个结合了计算机视觉、自然语言处理的跨模态研究问题,它的目的是能够将图像中的内容转译为符合人类习惯的自然语句描述,可以看作是对图像信息进行描述的任务,它可以为视觉信息自动生成描述。近年来,通过卷积神经网络提取图片中词特征的主要趋势。当前大多数的Image Caption(即图像自动描述生成)方法基于二段式编解码模型即encoder-decoder结构。然而目前主流方法对于图像特征的处理方式离有效提取图像中的语义信息还有一定差距,因而输出结果还不够理想。首先,本文对比学习并研究了近几年国内外图像方法,发现目前主流模型在图像特征提取阶段中主要提取单一的某种特征信息,即提取特征在类型与尺度上过于单一,无法生成全面的图像描述,并且单一的图像特征往往会导致识别错误致使文本输出内容错误。对于内容丰富的图像来说,单一特征的无法覆盖图像的完整语义信息,均存在一定缺陷。本文考虑在分别提取两种特征后通过自注意力模块来对分配图像特征权重来融合所有特征,以获取尽可能丰富以及准确的语义信息。其次,本文对于如何在生成语句中增强对物体的细节描述,使物体描述更加细致,使得输出描述在局部目标描述上更加完整进行了研究。目前图像自动描述生成方向使用的特征是经过卷积神经网络和区域候选网络提取的图像特征,将图像特征作为输入通过语言模型生成图像描述。为了使得模型能够和人一样通过控制对于视觉信息中主次信息进行筛选剔除噪声信息以及冗余信息,在任务中引入注意力机制企图达到同样的效果。但是目前的注意力机制是将图像特征中的有用信息和冗余信息同时作为输入特征,而冗余信息的存在直接影响了模型的准确性,导致忽略部分语义信息。本文从位置聚类的角度改进结果和特征之间的相关性,从而使模型能够针对性的学习物体区域特征与包含其细节信息的网格特征的互补关系,从而提高模型输出的完整性。最后,本文通过在Image Net数据集、Visual Gerome数据集和MS COCO数据集上进行训练,并在MS COCO数据集进行图像自动描述生成测试。通过与前人的研究方法验证了本文模型的有效性。
其他文献
航空指挥和保障系统是一个典型的复杂大系统,具有参与设备与人员众多、流程复杂、约束强和不确定性高等特点,这些特点增加对该系统效能预测的难度,并且随着仿真预测周期的变大,预测结果的可信度不断降低。针对如何保证航空指挥和保障系统效能预测可信度,提出了一种多分辨率模型构建理论方法,规范了模型标准化描述,并根据预测目的与周期,在预测过程中灵活运用近-中-远三段式的多分辨率模型组合仿真预测方法,对出动回收效能
研究目的:将齐刺针法与口服丹黄祛瘀胶囊联合起来治疗寒湿凝滞型SPID慢性盆腔痛,通过相关症状、体征、盆腔超声检查的观察、数据分析,总结二者合用对寒湿凝滞型SPID慢性盆腔痛的治疗成效,期望未来可以为临床医生在治疗选择上提供更多可能性。研究方法:采用随机分组的方式将符合纳入标准的66例患者分为齐刺联合丹黄祛瘀胶囊治疗(治疗组33例)、单纯口服丹黄祛瘀胶囊治疗(对照组33例)。3个月经周期治疗结束后通
企业作为创新的主体,应遵循时代发展的规律,抓住时代发展机遇进行技术创新,让创新成为企业高水平进步的强大引擎,在如今复杂的市场竞争里获得突出的地位。高管团队、内部控制作为企业运营管理过程里不可或缺的一部分,是促进企业技术创新的重要考虑因素。本文基于委托代理理论、高层梯队理论、信息决策理论和社会网络理论,以2012-2019年我国沪深A股上市公司为研究对象,从创新活动的产出入手,选取年龄、性别、金融背
<正>一、重庆市丰都县2家商砼生产企业垄断协议案2014年4月,重庆江都建材有限公司和重庆建典混凝土有限公司达成并实施联营协议,其行为排除、限制了竞争,损害公平竞争的市场秩序;通过固定销售价格、划分销售市场,使建筑企业失去对商砼的议价权和选择权,侵害了丰都县区域内建筑企业利益,违反了《反垄断法》第十三条第一项、第三项的规定,属于《反垄断法》禁止的达成并实施了垄断协议的行为。2021年6月15日,重
资本结构决策是企业财务管理的一个重要组成部分,其合理与否关系到公司能否以低廉成本获得融资。合理发挥财务杠杆的调节作用,会对公司的财务风险、盈利能力和长远发展产生直接的影响。公司存在确定的目标资本结构,但实际资本结构偏离其确定的目标资本结构的现象却普遍存在。资本结构是否进行调整、调整速度如何,部分取决于董事、高管这类管理层的意愿。其中董事会构成中独立董事占比由于其对公司治理结构的积极影响,也可能会改
运动性疲劳是经过一系列运动后机体不能维持在特定水平的状态,同时伴随生理指标发生变化。食源性活性成分来源广泛且安全,具有广阔的开发前景,食源性活性成分在缓解运动性疲劳方面的作用引起了关注。本文通过选取五种有代表性的食源性活性成分(茶多酚、人参多糖、黑枸杞多糖、人参总皂苷、海参肽),通过构建动物模型,评判其抗疲劳功效,对micro RNA表达变化进行分析,探究食源性活性成分抗疲劳的分子机制,主要内容如
在互联网和大数据的推动下,人工智能等现代信息技术正在取得突破性进展,数字化浪潮在世界范围内兴起,数字经济2.0时代方兴未艾。数字技术是实现社会信息化的核心驱动力。数字技术已经介入到人们工作和生活中的各个方面,数字经济将左右全球经济结构与竞争格局。政府报告中也明确提出发展数字经济和实施创新驱动战略,医药行业作为关系国计民生的重要产业,必须顺势而为,积极相应数字化号召,契合数字化发展大势进行转型,重塑
劳动教育直接影响着大学生的劳动精神面貌、劳动价值取向和劳动技能水平。论文以马克思主义劳动观为理论基础,依据党和国家领导人对劳动教育的重要论述,阐明大学生劳动教育的相关理论,尤其是劳动创造人、劳动创造人类社会、劳动揭示人的本质及帮助人实现自由全面发展的理论,进一步夯实了创新发展大学生劳动教育的理论基础。并通过纵向梳理中国传统的劳动教育思想、新中国成立后的劳动教育思想、改革开放后的劳动教育思想和新时代
近年来,普惠金融越来越受到世界各国银行业的重视,我国各大银行也不例外,纷纷进入该领域,采取一系列措施努力扩大金融服务覆盖面,降低客户成本负担。但是在如火如荼的发展态势下,普惠金融业务相对传统业务更高的风险正逐渐开始威胁各家银行普惠金融业务的可持续性。根据近些年的理论研究成果和银行业普惠金融发展实践,信用风险、市场风险、操作风险和道德风险是普惠金融业务最主要的四大风险因素,这些风险因素如果得不到有效
小微企业是我国创新体系中最基础且最具活力的基本细胞,对经济发展贡献巨大。发展普惠金融,助力小微企业降低融资成本,提高融资效率,是在当前经济大环境下发展实体经济,维持社会稳定的重要途径。J银行响应国家政策,将普惠金融作为自身的发展战略之一。2018年以来,小微企业贷款余额不断增长,业务发展迅速。由于小微企业自身抗风险能力弱,信用风险不断暴露,普惠金融贷款违约率逐年上升,因此,加强普惠金融业务风险管理