【摘 要】
:
图像美学质量评价的研究目的是为了让计算机能够模拟人类的思维和审美对一幅图像的美学价值产生判断,从而输出评分或者文字描述。而人类的视觉和语言是紧密相连的,看到图像总
论文部分内容阅读
图像美学质量评价的研究目的是为了让计算机能够模拟人类的思维和审美对一幅图像的美学价值产生判断,从而输出评分或者文字描述。而人类的视觉和语言是紧密相连的,看到图像总能以自然语言的方式表达一些美学的见解,这些语言中包括对图像美学方面的描述例如构图、光影、色彩等,因此对图像美学进行语言描述有着非常重要的意义,然而仅有的研究中美学描述的丰富性和流畅性方面也不够完善。为了解决现有的美学描述不完善的问题,本文首先提出了名为Deep Image Aesthetic Reviewer(DIAReviewer)的模型,该模型由CNN、美学语义添加层和D-Attention组成,这种网络结构可以使最终生成的美学描述更加流畅。本文提出的美学语义添加层是将CNN提取的图像特征与从美学描述中提取的美学描述特征融合成一个混合美学特征输入到D-Attention部分。D-Attention部分将代替传统的RNN,作为模型最后的文字输出部分。为了验证提出的模型,本文还构建了新的美学字幕的数据集(ARD)。经过实验,结果表明,本文的方法在产生更加流畅的美学描述方面有一定的性能提升。其次为了解决卷积过程中导致的美学方面的细节信息丢失的问题,本文还提出了DIAReviewer的改进模型,即DIAReviewer-II模型。该模型是在DIAReviewer模型基础上针对图像特征提取部分进行优化。即在VGG-19模型的基础上引入残差学习思想,结合空间注意力机制、通道注意力机制形成注意机制残差层。在模型中本文将第一个卷积层提取的图像特征经过空间注意力机制和通道注意力机制处理与最后一个卷积层进行残差学习,减少图像特征的损失,使CNN提取出的特征更多更加丰富,从而使输出的美学描述更加丰富。实验结果表明本文改进后的模型输出的语言在流畅性和丰富度上都有所提高。
其他文献
西南热电中心配套热力管线工程草桥电厂—京开高速柳村路段12~13号节点穿越暗河河道时回水管线发生抱管,无法单方向继续顶进,为解决此问题,采取了对接顶进,并取得了很好效果
作为物联网的触角,传感器迎来了新的发展机遇。而随着可穿戴行业的发展,电阻式柔性应变传感器在人体穿戴实时监测、机器人仿生皮肤、医学健康跟踪、运动肢体捕捉以及生产振动
长输油气管线工程频遇黄土冲沟,给管线的顺利施工和安全运营带来了困难。基于邓肯一张非线性弹性本构模型,利用数值模拟方法,对斜井开挖法穿越不同坡高冲沟的井周及坡体的受力变
多彩的垂直鼠标自问世以来深受广大消费者的深爱,以保护手部健康为诉求,在经历了第1代,第2代的成功后,多彩第3代垂直鼠标T5也隆重登场了。
初中英语新课标提出,以学生为英语课堂的中心,提高学生学习兴趣和提升英语学习效率成为初中英语教学的主要任务。现提倡培养学生的自信心和学生的合作学习能力,所以小组合作学习逐渐被引进到英语教学中。本实验以建构主义理论、兴趣理论和社会凝聚力理论为理论基础,旨在研究基于小组合作学习的英语教学实践,验证构建高效课堂的可能性。高效课堂包括学生有明确的学习目标,课堂效率高,学生积极主动参与学习,当堂学习目标达成度
针对艾比湖湿地保护区防风减沙、保持土壤的重要生态服务功能,利用两次实地土样采集、分析数据,以及精河、博乐、乌鲁木齐等相关区域问卷调查结果,综合运用生态经济研究中比较成熟的影子工程法、影子价格法、机会成本法和WTP法,结合研究区客观情况,辅以合理的修正系数,对其进行定量评价。评价结果为:研究区防风减沙、保土保肥的生态价值分别为2.303×108元/a和2.364×108元/a。其中,湿地生态系统在这
进入新时代,产业升级和经济结构调整对高校的人才培养方式、科研服务定位都提出了新的要求。本研究阐述了在产教融合背景下高校服务地方发展的主要内容,探讨了高校服务地方发
油井水泥石存在收缩大、脆性高的固有缺陷,易形成微间隙而导致地层流体互窜,造成油气采收率降低与油井寿命缩短。通过向G级油井水泥中掺入水乳树脂对其进行改性,同时掺入硅灰
肝硬化患者痔疮出血的严重程度远大于无肝硬化者。导师马素平,主任医师,硕士研究生导师,第五批全国名老中医药专家学术经验继承人,从事中医药防治慢性肝病20余年,对肝硬化及
对四川乡城县牛焦虫病的流行情况及其防治策略进行了介绍。