【摘 要】
:
图像美学质量评价引擎是很多视觉产品的基础,随着产品向社区化发展,出现了大量美学社区。在图像美学质量评价(Image Aesthetic Quality Assessment,IAQA)领域,如今普遍会在目标美学社区上直接微调一个预训练好的深度神经网络,然而这种做法存在社区图像数目不足和特征空间不匹配等问题,网络性能不够令人满意。针对上述问题,本文采用元学习的方法,定义了短期目标和长期目标,并设计任
论文部分内容阅读
图像美学质量评价引擎是很多视觉产品的基础,随着产品向社区化发展,出现了大量美学社区。在图像美学质量评价(Image Aesthetic Quality Assessment,IAQA)领域,如今普遍会在目标美学社区上直接微调一个预训练好的深度神经网络,然而这种做法存在社区图像数目不足和特征空间不匹配等问题,网络性能不够令人满意。针对上述问题,本文采用元学习的方法,定义了短期目标和长期目标,并设计任务分配方式以训练元学习者,赋予网络跨语义信息的“审美”标准,即面向内容的网络初始化表达。具有“审美”的网络在美学任务上有更迅速更出色的表现。自然图像是IAQA最大的目标,因此本文首先将元学习者应用在摄影社区上。本文依据摄影原则设计了一个基于元学习的双路多块图像美学质量评价网络(Meta-learning-based Double-Column Multi-Patch network,Meta DCMP),并提出了一个完全信息块选择方法,为网络提供包含丰富细节信息的原始分辨率图像块。本文还将元学习者应用在迅速发展壮大的插画社区上,对首次对插画流行度展开研究,这有助于人们有针对性地修改作品和制定决策,以吸引更多用户。通过对插画创作过程的分析,我们发现影响插画流行度最重要的因素包括图像内容、美学质量、时间、知名度等。针对图像内容和美学质量,本文设计了一个基于元学习的插画流行度评价网络(Illustration Popularity Assessment Network,IPANet),侧重于插画构图和插画风格这两点明显区别于自然图像之处;考虑到时间和知名度对于插画流行度的影响,本文还提出了一个以社区统计数据为依据的插画打分模型。在模拟美学社区应用场景的AVA-topic数据库上的实验结果,验证了元学习者的有效性;在AVA和插画数据库上的实验,分别证明了Meta DCMP和IPANet具有优越性。本文提出的方法和模型不仅提高了美学质量评价的准确率,更就网络初始化表达对IAQA任务的影响提出了有用的见解,为日后的研究工作打开思路。本文还首次对插画社区进行了成功探索,元学习者和图像美学质量评价方法必然会在更多社区和更多领域发挥更大作用。
其他文献
电子散斑干涉测量技术(Electronic Speckle Pattern Interferometry,ESPI)是一种现代光学检测技术,因其全场、无损、非接触等优点被广泛应用于诸多实际工程领域。在实际应用中,被测物的信息被反映在条纹图的相位中,所以准确地提取相位是成功应用ESPI技术的关键。条纹骨架线法是提取相位最直接的方法,该方法涉及去噪,二值化,骨架线提取,插值等技术。随着深度学习的发展,
<正>(2019年8月18日起)为进一步保障实验动物的福利,不断提升动物实验研究的水平并获得国际学术界同行的认可,根据我国和北京市实验动物有关法规和标准,在实验动物麻醉方法中,鉴于水合氯醛原属于镇静、催眠及抗惊厥药,作为麻醉剂效果较差,刺激性强、毒副作用较大,存在干扰实验结果、对实验动物不人道和有悖实验动物福利伦理审查原则等问题,国外期刊普遍建议不再使用水合氯醛作为实验动物的麻醉剂。因此,本刊自2
分布式光纤传感系统以光纤作为传感和传输元件,可以在整个光纤传感路径上实现分布式连续传感,且具有灵敏度高、耐高温腐蚀、抗电磁干扰、监测距离长等优点,被广泛的应用于机场、小区、边防等重要场所的周界安防中。光纤传感信号通常是非平稳的,在实际应用中,扰动信号具有复杂的信号模式,且易受各类噪声的干扰。如何准确实时的识别出入侵扰动信号,实现有效的入侵预警是周界安防领域研究的重点。本文针对入侵扰动信号的特征和实
在振动监测领域,传统的接触式监测由于使用方法的限制,其应用具有一定的局限性。为了实现非接触、全场式、多场景监测,基于机器视觉的监测技术成为振动监测领域的关键方法之一。本文以机器视觉为主要方法,以一维振动特征的提取与识别为主要目的,针对两类纹理特征不同的测试对象提出了两种有效的振动监测方法。针对自然结构明晰、纹理特征丰富的目标物体,本文采用图像预处理相关算法提取像素级振动特征,并提出了一种用于分类、
目的:分析BOPPPS联合情景模拟法在儿科护理学教学中的应用效果。方法:选取149名护理在校生作为研究对象,随机分为对照组(n=74)和实验组(n=75)。对照组采用传统教学法,实验组应用BOPPPS联合情景模拟法。比较两组护生理论成绩和操作成绩,以及教学前后学习主动性。结果:实验组理论成绩和操作成绩均高于对照组,且教学后实验组学习主动性评分明显高于对照组,均P<0.05。结论:BOPPPS联合情
随着图像、文本、视频等多模态数据的快速增长,如何高效且精准地进行跨模态检索成为了一个亟待解决的问题。跨模态检索旨在通过为不同模态的数据建立匹配关系,从而实现以某一模态数据作为查询,检索到具有相同或相近语义的其他模态数据。由于不同模态数据的底层特征之间存在异构鸿沟,使得对异构数据进行语义对齐有了很大的挑战性。本文主要针对跨模态检索中的图文匹配任务展开研究。首先,受到多任务学习和层次化表征学习的启发,
水下图像和视频作为获取海洋信息的重要载体,其质量直接决定获取到的信息的真实性和可靠性。光在水下传输时,会受到吸收和散射的作用,使得水下视频图像具有低对比度、模糊的纹理和严重的色彩偏移。这些失真对水下信息获取有着极大的影响,因此水下视频图像、清晰化尤为重要。近年来水下视频、图像清晰化领域受到了不少研究者的关注,但现存图像清晰化算法的鲁棒性不高,且将图像清晰化算法应用到视频清晰化时较少的关注清晰化后的
随着科技的进步,立体显示技术已逐渐融入人们生活工作的各个方面。立体效果的呈现依赖于人眼的立体视觉感知功能,所以立体视觉的相关研究对于立体显示技术的进一步应用发展具有重要意义。本文利用动态随机点立体图(dynamic random-dot stereograms,DRDS)结合脑电技术,对不同视差下水平运动DRDS的诱发脑电信号进行了识别,可以为立体视功能研究提供客观的理论依据。本文提出一种基于小波