论文部分内容阅读
摘要:随着信息技术的发展和宽带网络的普及,在线视频业务迅猛发展,也当今互联网上网络流量的主要贡献者之一。不断涌现的视频系统为互联网用户提供了十分多彩的节目内容,丰富了人们的生活。与此同时,丰富的互联网资源带给用户的过多选择使人们面临选择的负担,推荐系统也因此成为视频系统的必备。传统的个性化推荐会针对每个用户的兴趣推荐相应的视频,但是,当用户量增长到一定数量时,视频数据传输的速度和稳定性又会成为用户体验的瓶颈。相反的,群组推荐针对一定数量的兴趣相似的用户推荐相同视频,可以同时引导大量用户的观看行为,再结合P2P技术即可降低系统负载,是一种既考虑视频观看系统性能、又考虑用户兴趣满意度的有效推荐手段。本文采用了Pre-push数据集与PPTV流媒体视频播放系统的用户日志数据。我们采用社区发现技术实现群组推荐,并针对现有技术分团结果不均匀的问题提出了改进的社区发现算法;同时,选择合适的群组推荐策略进行推荐,并从系统、用户的不同角度出发进行结果评估。本文主要工作与贡献如下:(1)分析了PPTV数据集的用户和视频的统计信息,分析表明用户活跃度与视频流行度都符合幂率定律。同时,挖掘出数据集中隐含的用户兴趣信息,从而得到不同用户之间的兴趣相似度;(2)针对PPTV数据集缺少视频时长及用户评分字段的情况,设计了基于统计的隐式评分映射策略,将用户的观看时长映射为对视频的评分,从而有效地挖掘出数据中需要但缺少的信息,实验结果表明该策略在K-最近邻算法上表现良好;(3)讨论了P2P系统中Peer数与系统下载带宽、P2P率的关系,通过Pre-push数据集的分析表明,P2P率会随Peer数的增加而增大,并在Peer数达到一定程度时,进入一个平台期;(4)针对现在社区发现技术存在的不足,提出改进的算法,从而达到使得分团结果更为均匀的预期结果。实验表明,该改进算法可以在牺牲少量模块度下显著提高均匀度;(5)提出了一种结合用户兴趣和系统性能两种特征的群组推荐算法框架,实验结果表明,该改进框架可以有效地减轻系统的负载,达到系统性能、用户兴趣之间的平衡。