基于场景语义分割的照相位置推荐技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:zxd80509
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
照相位置推荐技术的目标是为用户推荐最佳的照相站立位置,帮助用户拍摄出更具美感的人景合影图片。该项技术的应用场景十分广泛,例如社交网络中的图片推荐、美图软件中自动化生成高质量内容,旅行记录中的合影留念等。目前照相位置推荐技术主要依赖于人工设计的图像美学评估模型和海量数据条件下的信息挖掘,许多工作已经对二维图像美学的特征融合进行了研究,但是对图像中三维信息的融合研究较少。大部分摄影场景包含丰富的语义信息,但现有照相位置推荐技术缺乏对场景语义信息的挖掘与利用。本文工作受计算美学理论的启发,提出了一种新的基于场景语义分割的照相位置推荐技术。该技术能够提取摄影场景中目标对象的语义信息,融合包括三维信息在内的多尺度美学评估模型,推荐用户在摄影场景中的站立位置,获取高质量的人景合影图片。本文对场景语义分割技术和图像美学评估技术进行了研究,主要工作包括基于显著性检测的场景语义分割技术和基于场景语义分割的照相位置推荐技术研究。1.改进了一种融合种子点与显著信息的场景语义分割方法,优化美学评估模型性能。人景合影包含丰富的语义信息,人类对摄影美学的评价规则受到语义场景的高度影响。本文工作对基于卷积神经网络的场景语义分割技术进行了研究,利用基于全局均值池化的种子点生成和语义标签赋值的显著信息估算对场景语义信息进行挖掘。该技术生成的场景语义信息能够提升图像美学评估效果。2.提出了一种新的基于场景语义分割的美学评估模型,该模型能够评估人景合影美学质量,为用户推荐照相站立位置。大部分摄影场景是在三维环境中,传统美学评估模型融合二维图像特征,但缺乏对三维信息的利用。本文工作对图像美学评估技术进行研究,根据场景语义分割信息,融合摄影美学计算,图像美感估算和综合显著性计算,评估人景合影图片美学质量。该技术能够推荐用户在摄影场景中的站立位置,有利于解决人景合影中人物布局优化问题。基于研究技术的成果,本文工作实现了一个基于场景语义分割的照相位置推荐原型系统。该系统应用于移动平台,通过服务端高速计算能力与客户端良好表现的结合,能够为一般用户提供基于场景语义分割的照相位置推荐。
其他文献
本文坚持历史唯物主义原则,以马克思在资本主义批判中所创立的生态正义批判理论为研究对象,梳理和分析马克思的生态正义批判理论的基本思想和理论主旨,展示马克思在生态正义
审判委员会制度是我国特有的司法制度,萌芽于特殊的历史时期与社会环境中,和其他制度一样,其产生与发展受到了多方面因素的影响。审判委员会制度得以产生与发展,并在我国司法
随着高性能计算机的广泛应用,高质量且低廉的摄像设备的易用性,加速了人们对视频内容自动分析和处理的需求,极大地推动了计算机视觉领域中视觉目标跟踪技术研究的发展。视觉
陈忠实所著的《白鹿原》是20世纪最优秀的长篇小说之一。作为一部民族的“秘史”,白鹿原全面展现了关中地区的民俗文化和语言特点,因此该书的翻译具有很大的价值和意义。笔者
顺应论认为语言使用是语言使用者根据交际语境的需要不断选择语言手段,以达到交际意图的过程。顺应论有四个研究视角,分别为交际语境、语言语境、动态顺应以及译员的顺应意识
中国电影已经走过一百多年的历程,取得了长足进步,类型电影日趋完善。其中,悬疑电影作为类型片的一种,近两年频频出现在银幕上,并且获得口碑票房双丰收,深受观众喜爱。而悬疑
近年来,我国市场主体救治和退出机制逐渐完善,作为预防企业破产最为积极有效的方式,重整制度在挽救困境企业、帮助其再生等方面发挥了重要作用。然而,我国传统的存续型重整在
本文在言语行为理论的指导下,分析了作者在2018年人才市场做的一次翻译实践。该实践的主要特点体现在招聘话语有其独有的特点。作者通过分析发现,其主要特点就是招聘方和应聘
通过集体合同来调整劳动者集体和企业之间关系的制度发源于西方市场经济较为发达的国家,经过几个世纪的发展和完善,逐步成为平衡劳资力量、协调社会经济秩序的一项重要制度。
随着中国不断的深化与其他国家的人文交流,中国的电视节目也越来越国际化,世界各地的表演者在中国的舞台上展示文化魅力和个人风采。外国表演者在中国录制节目的过程中,由于