视频网站推荐算法的研究与应用

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:fyps
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的飞速发展,人们每天被各种各样的数据所包围,信息已严重过载。与此同时,人们生活节奏越来越快,用来供娱乐和放松的时间越来越短。如何从海量的信息中挖掘出用户感兴趣与有价值的信息,特别是在用户没有目的的情况下,这一问题日渐成为各大机构和学者所关注的问题。个性化推荐系统成功缓解了该问题。目前国内外的各大推荐系统中,如视频推荐系统,电子书推荐系统、音乐推荐系统等,均普遍存在长尾效应的现象。长尾效应的存在严重影响了推荐系统的资源利用率、推荐结果的多样性,以及不利于企业谋取长远利益。本论文致力于降低长尾效应对推荐系统的负面影响,在不影响系统准确率的前提下提高系统的资源利用率。本论文致力于以下工作:第一、通过大量阅读国内外科技文献,深入研究推荐系统中出现的长尾效应现象,分析该现象出现的原因,明确对长尾效应进行研究的意义,调研当前各国学者专家对该问题的研究现状,弄清各算法的原理,比较各解决方案的优缺点;第二、对本论文所涉及到的关键技术进行深入研究,为进一步降低长尾效应对推荐系统造成的负面影响,本文提出了改进的协同过滤长尾物品推荐算法 PGSim-CF(PageRank Similarity Collaborative Filtering Algorithm)。该算法是对项亮在推荐系统实践一书中介绍的传统基于用户的协同过滤UserCF算法进行改进,具体的改进过程为:首先利用PageRank算法计算出系统中各物品的初始权值,然后通过同类物品中热门物品的权值去优化冷门物品的权值,得到各物品的最终权值,最后将最终权值融合到协同过滤算法相似度计算的过程中。实验结果表明,PGSim-CF算法同传统的基于用户的协同过滤算法UserCF、SimCF-ACT算法、IRM2算法相比具有更好的性能;第三、结合某互联网视频网站的用户需求,完成了互联网视频网站的推荐系统架构设计、底层存储设计、数据清洗、模型参数调优、推荐结果的分析等工作,重点完成了推荐引擎的设计,实现了热门视频实时推荐算法以及基于评分的PGSim-CF和UserCF的离线推荐算法;第四、对某运营商视频点播系统进行需求分析,重点完成了该点播系统的数据清洗以及推荐引擎搭建相关的工作。数据清洗主要是从海量的数据中挖掘出用户观看视频的信息、以及在观看视频中产生的播控信息,通过对这部分数据的分析计算得出用户有效观看时长以及观看时长占比率。最终提供了热门物品的实时推荐算法以及基于用户观看时长占比率PGSim-CF的离线推荐算法。
其他文献
以各省级人民政府历次公布实施的征地统一年产值标准和区片综合地价政策为基础,统计、整理、分析了征地补偿标准的总体情况,分析、测算了征地补偿标准更新与调整的变化趋势及
我国内河水运资源丰富,经过50多年的建设,已经初步形成了以长江、珠江、淮河、黑龙江等四大水系为骨干的内河航运体系。黑龙江水系主要通航河流有黑龙江、松花江、嫩江、乌苏
10月17~19日,由德国罗曼动物保健有限公司主办,兽医导刊杂志社协办的“罗禽保鸡肠炎沙门氏菌病活疫苗上市发布会暨家禽沙门氏菌防控与食品安全研讨会”在北京九华山庄举办。北京
农村小学寄宿生是一个既不同于一般儿童,又不同于留守儿童和流动儿童的一个特殊群体。从某种意义上来说,这一群体的处境较留守儿童和流动儿童更为不利。已有研究表明,我国儿
股利政策是公司四大财务管理活动之一,它是公司融资与投资活动的延续,是公司经营活动的成果体现。制定适当的股利政策是学者们孜孜不倦研究的课题。上市公司的股利分配行为直
目的:探讨基因组微卫星DNA与胃癌的关联,胃癌主要临床实验指标的变化情况及实验指标和基因组微卫星DNA之间的关联。方法:胃癌组是因胃癌住院患者,共31例,男18例,女13例,年龄
为了能清楚地了解无攻角弹体斜侵彻多层间隔混凝土靶板的特性,采用LS—DYNA3D动力有限元软件对弹一靶作用过程进行了一系列数值模拟研究,描述了斜侵彻过程中的基本现象,分析了弹
公路隧道作为公路的组成部分,在现在社会中扮演着十分重要的角色。公路作为国民经济的命脉,发挥着其他运输方式不可替代的作用。隧道的修建缩短了公路的里程,提高了公路路线
目的探讨PBL教学法在中医外科学实习带教中应用的效果。方法将医学本科类实习生72名随机分为PBL教学带教(实验组)36人和传统带教(对照组)36人。实习结束后,比较2组学生中医外科学
结合京沪高速铁路四标段某路基CFG桩桩帽施工工程实例,介绍了CFG桩桩帽预制与现浇之间在施工工艺、施工工序和质量控制方面的不同,从而为今后类似的施工积累相关经验。