基于机器学习的立体视频视觉显著模型研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:tanya_33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像视觉显著度的研究一直以来都是计算机视觉领域的一个重要研究课题。研究图像视觉显著度不仅可以帮助我们理解人类的视觉注意机制,而且在图像裁剪、视频压缩以及图像的伸缩变换等方向具有远大的应用前景。经过多年的努力,研究者在二维图像的视觉显著度研究中已经获得了许多重要的成果。然而随着立体影像制作、播放技术的快速发展,视觉显著度研究迎来了新的挑战。因为立体影像引入的深度感知会影响人们的视觉注意,进而影响图像的视觉显著度。一直以来研究者都在努力构建一个能够准确预测图像视觉显著度的模型。特征综合、引导搜索等认知理论表明构建一个优秀的视觉显著度模型关键在于特征选取和特征融合这两个方面。本文也从这两个方面出发,努力构建一个能够尽可能准确预测立体视频显著度的模型。在提取特征时本文依据人类的视觉注意机制提取了立体视频帧的DCT变换特征、Itti三通道特征、子带特征、颜色空间特征、深度、运动、中心偏向等全局显著特征以及使用卷积神经网络获取了局部显著特征。对以上特征经过分析、对比和实验,针对不同的特征融合方法选用了不同的显著特征组合。然后分别采用支持向量机和卷积神经网络进行多特征融合。其中在使用卷积神经网络进行特征融合时,针对本文选用的显著特征组合,对卷积神经网络的一般性架构进行了优化,去除了下采样层,使其学习效率和学习效果得到了提升。最后将本文提出的模型与其它数个立体视觉显著度模型采用显著图直观评价、ROC和P-R曲线、AUC、F-measure、PLCC和KLD等多种评估方法进行对比评估。同时分析了不同模型对于不同场景类型显著度预测的鲁棒性。对比评估结果表明本文提出的视觉显著度模型的预测结果具有优势,其中采用卷积神经网络进行特征融合的模型结果最优。并且基于机器学习的模型对于不同类型的场景具有更好的鲁棒性。
其他文献
学位
目的 探究侧卧斜仰截石位标准通道无管化经皮肾镜取石术治疗复杂肾结石的临床效果.方法 120例复杂肾结石患者,应用等量电脑随机的方式分为实验组和对照组,每组60例.对照组患
Aglycin是Chen等在研究胃肠道多肽激素时从猪小肠中分离并鉴定出的一个生物活性肽,分子量为3742.3D,含37个氨基酸,其中有6个半胱氨酸,分别位于3、7、15、20、22和32位。因氨基端
该文探讨能否通过抑制TIMP-1的产生来阻断或减少对MMPS的抑制作用,达到降解过多堆只的ECM的目的的可能性,为临床肺间质纤维化的逆转治疗提供新的思路和方法.1、以博莱霉素诱
该论文的研究的主要内容包括R-工程菌发酵条件研究、酯酶B1的分离纯化和酯酶B1的酶学性质研究.研究表明,接种量5﹪时,R-工程菌在pH6.7的LB液体抗性培养基上37、200rpm震荡培养1
目的 分析老年梗阻性结肠癌临床外科治疗效果.方法 60例老年梗阻性结肠癌患者,根据手术时机的不同分为对照组和观察组,各30例.对照组患者行急诊手术治疗,观察组患者行择期手