【摘 要】
:
准确地预测并计算视频显著性是视频质量评估、视频摘要、视频压缩和视频再定位等研究的基础。有研究表明即使从单个观察者收集的眼动数据生成显著图的效果也优于现有的视频自动显著模型,因而基于人眼注视数据确定视频显著性的方法更为有效。由于观察者的个体差异,通常需要大量的眼动数据来逼近真实的视觉显著性图。但是,针对众多观察者采集眼动数据不仅耗时而且成本较高。为了获取显著性的计算准确度和采集成本之间的平衡,本文研
论文部分内容阅读
准确地预测并计算视频显著性是视频质量评估、视频摘要、视频压缩和视频再定位等研究的基础。有研究表明即使从单个观察者收集的眼动数据生成显著图的效果也优于现有的视频自动显著模型,因而基于人眼注视数据确定视频显著性的方法更为有效。由于观察者的个体差异,通常需要大量的眼动数据来逼近真实的视觉显著性图。但是,针对众多观察者采集眼动数据不仅耗时而且成本较高。为了获取显著性的计算准确度和采集成本之间的平衡,本文研究如何预测和推荐出视频显著性计算所需的最优眼动数据个数。通过分析多种类型的视频及其对应的眼动数据特性,发现视频内容的差别导致了生成相同质量的显著性图所需眼动样本数目的不同。文章首先通过设计包含纹理、运动、显著性图等多角度的特征模型来对视频进行描述。然后为了预测视频计算给定精度的感兴趣区域所需眼动数据个数提出了两种方法:第一种是基于支持向量机的分类预测模型,在给定精度阈值的基础上,通过对眼动数据生成的注视一致性曲线(多维向量)进行聚类,统计出类别与所需眼动数据个数之间的关系,进而构建出多角度特征模型与视频类别关系的支持向量机分类预测模型;第二种是多元线性回归预测模型,给定精度阈值,将多角度特征模型作为回归模型自变量,视频所需眼动数据个数作为回归模型的因变量,构建出直接预测视频眼动实验所需的最优人数的多元回归预测模型。最后将预测数目对应的眼动数据生成的感兴趣区域应用于视频压缩中,实验结果表明,在相同码率下比直接压缩的视觉质量更好。本文的主要贡献总结如下:(1)构建了一个描述视频的多角度特征模型,包含基于纹理的统计特征,连续帧运动特征以及基于显著区域的显著特征。(2)为了拟合视频多角度特征模型与给定阈值精度下所需眼动数据样本数之间的映射关系,提出了基于支持向量机的分类预测模型与多元线性回归预测模型的两种方法。(3)用户可通过指定精度阈值的方式来控制采用相应数目眼动数据生成感兴趣区域的准确度。对于0~1的任意阈值,均可快速建议出视频显著性眼动实验所需的最优人数。
其他文献
话语标记语广泛存在于日常用语中,它不影响句子的真值,但其使用是否得体影响话语的生成和理解,在很大程度上对维系社会各层面上的人际关系也起着重要作用。国内外学者多从语
本文在中、低压汽水试验台上对卧式螺旋管内汽液两相流动不稳定性进行了详细的试验研究,获得了各类脉动发生的界限及各主要参数对脉动的影响规律,并在无固次分析的基础上,给出了
黑格尔对哲学的看法消解了开端的观念,但是,包括逻辑学在内的黑格尔的哲学体系却是有开端的。这个开端就是"纯有",需要注意的是,纯有既包含最简单的直接性又包含有待展开的间接
为了促进计划疫苗损害救济的实现,保障公民健康权益,基于法的规范分析,计划疫苗预防接种应是一种具体行政行为,体现了强制医疗法律关系。接种单位在履行预防接种职责时,如果
进行在校大学生对辅导员工作满意度调查是对辅导员工作进行客户检验,本次调查选取南京具有代表性的五所高校进行随机抽样调查,得出了相关结论。调查显示,南京高校的辅导员工作虽
采用文献回顾法探索国内医院安全保卫工作的研究现状与热点。通过分析文献发现,目前我国医院安全保卫存在的主要影响因素主要包括社会因素、环境因素、机制因素、专业人才缺
根据《国营企业固定资产折旧试行条例》(以下简称《折旧条例》)的规定,对任意改变国家统一规定的固定资产分类折旧年限,多提或少提折旧的,应按照规定进行处理。但是,随着经
应荷兰富乐科瓦科公司、法国法兰西水泥公司、德国依比克国际贸易公司的邀请,国内贸易部散装水泥仓储及运输技术代表团一行14人,于1997年12月2日至20日,赴德国、荷兰、法国、
随着我国建设项目规模不断扩大,工程项目竣工结算审计越来越严格,对工程结算中竣工材料要求越来越高。本文阐述了工程结算中竣工材料的常见问题,分析了提升竣工材料质量的相
掌握科研院所财务评价指标的计算方法,科学合理地分析计算结果,有利于提高科研院所财务管理的水平,从而推进其财务工作科学化、规范化、制度化与标准化建设。本文借鉴2013年版的