论文部分内容阅读
随着互联网的不断发展,人们每天可以接触和产生大量的数据,随之导致信息的利用率出现下降,出现了所谓的信息过载问题。推荐系统是解决信息过载问题的智能代理系统,它根据用户的个人兴趣偏好或需求向用户推荐感兴趣的对象,提供完全个性化的决策支持和服务。推荐系统的核心是推荐算法,本文在对推荐算法进行深入研究后,提出一种解决视频协同过滤算法中扩展性问题的视频数据清理算法,以及一种基于依赖度的社会化推荐算法。协同过滤中算法扩展性问题是指随着用户数据的增大,算法的响应时间出现明显上升的情况。视频数据清理算法致力于去除用户行为中不能代表用户兴趣的视频,使算法可以在规模更小但更有效的数据集上提取用户兴趣,从而达到降低响应时间的目的。为此,本文考虑了时间周期、行为顺序、不对称性等特性对视频间相似度的影响,改进了相似度的计算方式。在此基础上重新定义了用户对已观看视频的兴趣值,然后将兴趣值最低的视频集合按照一定规则进行清理,认为它们可能是用户兴趣的干扰数据。社会化推荐算法中,本文定义了一个用户之间依赖度的指标,它由用户之间的信任度、目标用户的信誉度以及用户之间的兴趣相似度组成,算法最终向用户推荐依赖度最高的用户集合喜欢的视频。度量用户间兴趣相似度时,本文不仅考虑用户正样本的贡献,也考虑了负样本的贡献,并提出了一种采样用户负样本的方法。用户之间的信任值取决于他们在社会网络中的熟悉程度和他们的兴趣相似度,而用户的信誉度取决于整个社会网络中其他所有用户对他的信任值。该算法充分利用了用户的社会化关系和行为信息,综合了协同过滤推荐和基于社交网络推荐的优点,实验结果证明该算法比单独使用用户行为或社会化关系的推荐算法具有更好的性能。为了使本文的研究成果得到充分利用,论文作者设计实现了一个在线视频推荐系统,包括用户的管理、视频的管理、数据的管理和推荐算法等功能,并在系统中成功部署了本文提出的基于依赖度的社会化推荐算法。