论文部分内容阅读
照相位置推荐技术的目标是为用户推荐最佳的照相站立位置,帮助用户拍摄出更具美感的人景合影图片。该项技术的应用场景十分广泛,例如社交网络中的图片推荐、美图软件中自动化生成高质量内容,旅行记录中的合影留念等。目前照相位置推荐技术主要依赖于人工设计的图像美学评估模型和海量数据条件下的信息挖掘,许多工作已经对二维图像美学的特征融合进行了研究,但是对图像中三维信息的融合研究较少。大部分摄影场景包含丰富的语义信息,但现有照相位置推荐技术缺乏对场景语义信息的挖掘与利用。本文工作受计算美学理论的启发,提出了一种新的基于场景语义分割的照相位置推荐技术。该技术能够提取摄影场景中目标对象的语义信息,融合包括三维信息在内的多尺度美学评估模型,推荐用户在摄影场景中的站立位置,获取高质量的人景合影图片。本文对场景语义分割技术和图像美学评估技术进行了研究,主要工作包括基于显著性检测的场景语义分割技术和基于场景语义分割的照相位置推荐技术研究。1.改进了一种融合种子点与显著信息的场景语义分割方法,优化美学评估模型性能。人景合影包含丰富的语义信息,人类对摄影美学的评价规则受到语义场景的高度影响。本文工作对基于卷积神经网络的场景语义分割技术进行了研究,利用基于全局均值池化的种子点生成和语义标签赋值的显著信息估算对场景语义信息进行挖掘。该技术生成的场景语义信息能够提升图像美学评估效果。2.提出了一种新的基于场景语义分割的美学评估模型,该模型能够评估人景合影美学质量,为用户推荐照相站立位置。大部分摄影场景是在三维环境中,传统美学评估模型融合二维图像特征,但缺乏对三维信息的利用。本文工作对图像美学评估技术进行研究,根据场景语义分割信息,融合摄影美学计算,图像美感估算和综合显著性计算,评估人景合影图片美学质量。该技术能够推荐用户在摄影场景中的站立位置,有利于解决人景合影中人物布局优化问题。基于研究技术的成果,本文工作实现了一个基于场景语义分割的照相位置推荐原型系统。该系统应用于移动平台,通过服务端高速计算能力与客户端良好表现的结合,能够为一般用户提供基于场景语义分割的照相位置推荐。