论文部分内容阅读
随着中国对6G网络的研究,以网络视频为代表的网络娱乐将取得空前的发展,而如何及时有效的向用户推荐其感兴趣的网络视频是布局国内市场至关重要的一步。再加上智能时代的到来,用户打破了传统网络视频的壁垒,并可以自定义上传视频,使得网络视频数量、种类激增。在这种情况下,视频用户要找到自己感兴趣的网络视频将必然需要浪费大量的资源而且还事倍功半。因此,用户急需要一款体验高的视频推荐系统来帮助自己筛选视频,从而缓解由网络视频“信息过载”问题所带来的诸多挑战。目前最流行的推荐系统算法是协同过滤算法,然而其依然存在评论数据稀疏、冷启动、扩展难度大和用户体验低等难题。虽然有许多专家学者对其进行改良融合,但最终效果还是不理想。其主要原因是用户自发的网络视频无规则可言,对其建模困难;用户年龄的变化其兴趣爱好也跟着改变;网络视频特征提取困难;用户现如今越来越注重自己的隐私,开始有意识的减少对网络视频的评价;有的不法网络视频提供商为了推出质量差的网络视频不惜违法雇佣“水军”对视频的评价造假等。这些问题导致目前推荐系统很难精准挖掘出用户的爱好,从而导致用户体验很差并让他们逐渐失去了使用推荐系统的兴趣。针对以上问题,本文提出基于聚类层次模型的视频推荐算法(Video Recommendation Algorithm Based on Clustering and Hierarchical Model,VRBCH)来提高推荐系统的性能,从而进一步改善用户体验。首先,从相关用户方面着手利用用户自身属性,采用矩阵分解思想来填补用户属性矩阵的缺失项,避免了用户因为隐私问题影响相似用户的聚类效果。然后通过近邻传播(Affiliation Propagation,AP)聚类分析得到属性相似用户,通过属性相似用户找出目标用户可能隐藏的爱好特征以及发掘出目标用户的潜在爱好。然后利用视频抓取工具收集相似用户浏览的网络视频,并在历史日志中寻找用户浏览视频的路径,采取网络视频排序计算出用户对视频的喜爱值,进而形成视频预推荐集合。避免了系统直接从海量的视频中随机推荐给用户,另外利用用户行为可以挖掘出用户无法表达或表达不清楚的潜在兴趣爱好。其次,利用用户行为的历史数据计算出用户对视频的喜好值,再把视频的喜好值转换成视频的标签权重,避免了依靠专家的群体经验来预测某个个体喜好带来误差。最后,通过层次分析模型算出视频推荐集合中用户喜好视频的排序,产生推荐列表,对提高用户体验有着积极的效应。基于MovieLens Latest Datasets和YouTube视频评论文本数据集,实验结果表明所提算法在均方根误差和决策精度方面均表现出良好的性能。