海量视频节目的检索、推荐与反馈学习

被引量 : 0次 | 上传用户:yannini01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络和数字多媒体技术的发展,互联网应用日益普及,网络多媒体数据量急剧膨胀使得人们难以获取有用的信息和服务。面对海量媒体数据,如何有效的处理、检索和推荐,逐渐成为多媒体视频应用和信息管理系统领域中亟待解决的问题。本文研究问题集中于以下三个方面:1)多媒体检索的研究逐渐从关键词检索方式转向对象检索方式,即以视频片段为输入,从海量视频库从找出相似视频。以视觉单词为基础的常规检索方法,忽视视频帧时间序列上的关联,在检索效果上仍有提升空间。如何考虑视频帧序列关系,并保持可接受的检索速度,值得进一步研究。2)基于协同过滤的方法是推荐系统领域的一类热门方法,广泛用于在线电子商务中。然而,传统协同过滤方法面临多种问题。近年的研究表明,对象选择存在“长尾效应”,大量对象因缺少用户关联信息而被传统协同过滤推荐算法所忽视。同样是缺少足够的用户-对象关联信息,对象“冷启动”问题也一直成为协同过滤推荐系统研究难点。如何利用对象自身特点找出相似关联性,克服协同推荐中关联信息缺失问题,值得进一步研究。3)实际应用场景下,单纯基于显式反馈(如评分等直接评价信息)的推荐算法,需要用户主动配合反馈信息采集,一定程度上影响用户体验,致使该类推荐系统常面临反馈信息不足问题。而大量隐式反馈信息,如浏览网页的时间,观看视频多久后切换,以及对象选择的先后顺序等,在不影响用户正常浏览的同时,也为推荐系统提供丰富的信息。如何有效利用用户隐式反馈信息,弥补显式反馈信息的不足,值得进一步研究。针对上述三个问题,本文的主要工作和创新包括以下三点:1)支持复制检测的相似视频检索性能优化方法研究:为了提高相似视频检索的性能,本文提出一种支持复制检测的相似视频检索方法。该方法首先对视频片段进行系统采样,提取视频帧的全局特征向量,并对特征向量哈希得到特征点,将视频表示为特征点的时序序列。检索过程将特征点视为视觉单词,利用倒排索引,快速计算两个视频的相同特征点种类和离散度,对无关候选对象进行过滤。序列距离采用基于Jaccard距离的动态时间规整(Dynamic Time Waring, DTW)度量方法,利用距离下界的快速估计,对相似序列搜索过程进行优化。实验表明,采用多级评价准则的检索方法在同样检索效果下,所耗时间仅为原DTW算法的1/3。与MUSCLE VCD2007数据集公开实验结果对比,本方法的检索得分/时间比值高于其他算法结果。2)基于语义本体表示的视频推荐方法研究:针对推荐系统中的对象信息稀疏问题,本文提出一种语义本体表示的视频推荐方法,用于对用户评分矩阵中缺失的评分信息进行预估,提升对长尾对象和冷启动对象的推荐效果。以电影数据为例,该方法首先根据电影本体属性间的相似度,确定相似电影的候选集。利用用户对候选集电影的评分,预测该用户对电影的评分值,并对评分矩阵进行填充。最后采用PureSVD算法对填充后的矩阵进行分析,将Top-N电影推荐结果返回用户。实验采用Hetrec’11电影评分数据集测试,并用推荐结果的Top-N召回率进行评估。结果表明,相比于目前多种的推荐算法(TopPop,近邻推荐,PureSVD),本文方法对于一般对象的推荐召回率提升240%~30%,对于长尾对象的推荐召回率提升2-5倍,并能有效处理对象冷启动问题。3)结合隐式反馈的对象推荐方法研究:针对实际应用场景下显式反馈信息不足问题,本文提出了一种结合隐式反馈的对象推荐方法。该方法将用户的隐式反馈信息转化为0-1用户-对象评分矩阵,并放入有向关联图结构中。采用时间窗口技术,对图中隐式反馈的影响范围进行限定。利用HITS算法迭代计算出关联图中对象的auth权重和hub权重,作为对象的隐式反馈推荐评判依据,并与显式反馈推荐值融合,获得最终推荐列表。基于MovieLens公开数据集的实验结果表明,隐式反馈信息可以作为显式反馈的有效补充,相比PureSVD协同推荐算法和ItemRank等基于显式反馈的图类推荐算法,本文方法获得的推荐列表序列正确度得到进一步提升,平均序列正确度达到90%以上。本文研究是国家科技支撑计划课题“增强型搜索系统架构、关键技术及测试规范的研究”(2011BAH11B01)以及国家科技支撑计划课题“电视商务综合体新业态应用示范”(2012BAH73F02)的一部分。
其他文献
在对深水油气开发技术发展现状及开发工程案例进行较详细分析的基础上,把当前典型的深水油气开发工程模式划分为9个类型,并指出了各种开发模式的适用条件。而后结合国内外技
目的控制治偏痛颗粒的质量。方法建立高效液相色谱法测定治偏痛颗粒中芍药苷的含量。色谱柱为岛津Shimpack CLC-ODS色谱柱(6·0mm×150mm,5μm),流动相为甲醇-0·05mol/L磷酸
随着社会经济的发展,牛奶及其相关产品已经成为社会生活中重要的组成部分。所以,对牛奶产量的科学预测具有十分重要的实际价值。本文从1962年1月至1974年12月的月度牛奶产量
目的:探讨研究对慢性胃炎和消化性溃疡患者给予综合护理干预后其生活质量的改善情况。方法:选取140例慢性胃炎和消化性溃疡患者,将其作为研究对象,并随机分为对照组和试验组,
文章对高频变压器的设计进行了深入研究,并结合实际利用面积乘积法即AP法设计了一款逆变电源中的高频变压器,并通过实验对设计方案进行了验证,结果证明这种设计方案是确实可
介绍了综艺晚会中,灯光设计师服从和创造性地体现导演的总体设想,在真正理解了节目"亮点"何在的前提下,运用中国美学观念中的若干原则,进行灯光效果改进的几个思路。
在目前的经济新常态下,房地产企业文化建设显得尤为重要。为了对房地产企业文化进行科学合理的评价,在综合前人研究的基础上,利用模糊综合评价方法,建立了基于模糊综合评价法
<正>阅读点从知识结构、闲暇时间、精神需求等层面看,农民工也具备成为大众媒介受众的基本条件,应当成为受众发掘的新增长点。但是,这样一个体量庞大的社会人群,却一直是少有
波纹膨胀节是用于补偿管道的热膨胀及各种位移的新型补偿元件。本文结合轴向型膨胀节设计中遇到的问题,讨论了它的轴向力,并由此对美国标准推荐的确定导向支座间距的公式提出
本文介绍了纸张的组成和纸张本身固有的性能——吸水性对胶印套准的负面影响,并针对这些影响提出了可能的解决方法。