基于深度学习的无参考视频质量评价

来源 :江南大学 | 被引量 : 0次 | 上传用户:ktyl2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当下,由于智能设备的普及和移动网络的快速发展,我们周围充斥着各种各样监控和直播视频。人们观看视频不但可以丰富自己的业余生活,也可以从视频中获取大量的知识,因此视频在人们的生活中扮演着越来越重要的角色。但是,视频在录制、压缩编码、传输等过程中往往容易会产生失真,视频质量的好坏直接影响到人们对视频的主观感受。当判断视频质量作为一项人为工作时,费时费力且受主观影响,因此需要计算机对视频进行客观质量评价。在客观视频质量评价中,当前大部分研究学者都采用传统的手动提取特征,利用浅层学习机去预测视频质量分数,这样分阶段手动提取特征导致其结果并不太理想。随着深度学习的发展,越来越多的研究学者开始使用深度学习去解决图像质量评价。由于视频质量评价相比较于图像质量评价有较多难点,需要同时考虑视频时序、样本少等原因,导致这方面的研究相对较少。但是出于卷积网络在特征提取方面有出色的表现,所以本文克服上述问题使用深度学习的方法来研究视频客观质量评价。本文的研究的内容与成果总结如下:(1)提出了一种基于时空域特征提取的无参考视频质量评价方法。该方法考虑视频帧的时空域特征,首先使用帧差图来提取因抖动导致视频质量下降的时域特征,帧差图上利用卷积神经网络提取失真视频的时空域特征,然后使用PCA对特征进行降维处理,最后使用Xgboost对特征进行线性拟合得出视频最终的客观质量评分。在现有的视频质量评价数据库中的实验显示,本章的方法能够很好的预测视频质量的好坏。(2)提出了一种基于迁移学习的无参考视频质量评价方法。该方法避免了分阶段视频质量评价的繁琐,采用端到端的网络结构进行视频质量评价。在实验中,首先构建端到端的卷积神经网络,迁移VGG-16卷积层的参数,达到加快收敛和缩短训练时间的目的,然后对视频帧做切块拼接等处理,最后将拼接好的样本送入网络进行端到端的拟合。本章方法能够避免分阶段寻找特征,然后进行回归预测,有效的提高视频质量评价的精度。经过现有视频质量库的实验数据显示,能够很好的与人眼达到很好的主观一致性。(3)提出了一种基于循环神经网络的无参考视频质量评价方法。该方法很好的解决了视频时空域特征的提取。本实验是在方法(2)的基础上进行改进,迁移VGG-16卷积层参数后构建循环神经网络,即卷积网络用于提取空域信息,循环神经网络用于提取时域信息。两者的结合,在视频质量评价库中实验结果来看,能够很好的反映视频的主观得分情况,且本章方法同样是端到端进行训练和预测,提高了预测精度。
其他文献
<正>这是一所占地13400平方米的新村配套小学,她创办于1988年9月,现有30个教学班,1560多名学生,82名教职员工。学校建校之初,即确立了"高举教育现代化大旗,全面实施素质教育,
<正>一、逐步解答策略高考数学中的最后一道题,一般来说会根据由简单到困难设置2个~3个问题,每个问题之间是有一定联系的,前一问是后一问的基础,后一问有时候会参照前一问所
目的了解昌平区中小学校管道直饮水的卫生质量,为保证管道直饮水水质和系统有效运行提供决策依据。方法按《生活饮用水检验规范(2001)》和GB/T 5750-2006《生活饮用水标准检
<正>2010~2015年,A股市场发生重大资产重组、要约收购、定增重组的公司数量不断增加,上市公司整体商誉呈逐年增长态势,后续商誉减值也呈同步上升态势近年来,我国经济结构调整
本文探究了不良网络文化对我国青少年造成的负面影响,同时提出了在新的形势下解决这些问题所应采取的对策,那就是对青少年学生上网宜"疏"不宜"堵";做好上网学生的心理引导工
研究了 5种表面活性剂 :吐温 80 (Tween80 ) ,十六烷基三甲溴化胺 (CTAB) ,溴代十六烷基吡啶 (CPB) ,十二烷基硫酸钠 (SDS) ,十二烷基苯磺酸钠 (L AS)对牛血清白蛋白 (BSA)性
自从电子商务兴起的二十多年以来,其灵活性使得它可以不断发展出新的经营模式来适应多变的市场需求。在电子商务模式愈发成熟的今天,一个操作简单,功能齐全,安全性能相对较高
目的探讨长期吸烟对男性高血压患者血压昼夜节律的影响,进一步阐述晨间血压上升速度是否是发生心血管事件的危险因素。方法选择男性高血压患者300例,年龄40~79岁,受试者均无糖
目的分析大学毕业生心理弹性、自我分化与就业焦虑间的关系,为缓解大学生就业焦虑提供建议。方法采用自我分化问卷、大学生就业焦虑问卷及成人心理弹性问卷,对河南省8所高校