论文部分内容阅读
信息资源已经成为社会的一个重要组成部分。随着信息资源的快速增长和对信息的高效访问获取,从这些数据中挖掘出有意义的信息也开始被重视起来。为提高用户在网站中的访问体验,降低用户的信息浏览时间,提高用户忠诚度,个性化推荐系统及其相关研究随之产生。目前,个性化推荐系统在视频观看、音乐播放、新闻浏览和电子商务等领域都获得了越来越广泛的应用。本文主要对推荐系统中的结构化数据处理,用户模型构建,推荐算法及其混合策略进行了研究。利用混合推荐方法解决推荐系统中存在的新物品推荐问题,稀疏数据用户推荐等问题,最终完成视频推荐系统。在个性化推荐系统中,通过网络爬虫方式获取视频项目文本描述数据,然后,对视频文本数据进行清洗和结构化处理,最终,生成视频的结构化描述数据。结构化描述数据在推荐系统中具有重要的作用。在用户行为分析中,通过分析用户行为数据,生成用户对项目的偏好值。根据用户对项目的偏好和项目的结构化视频数据生成用户的基于内容的偏好特征。同时使用三元组数据模型完成对用户项目数据的表示,采用向量空间模型构建用户基于内容的偏好模型。在构建推荐系统时,采用了三种推荐算法和两次结果混合最终生成用户的推荐结果。推荐算法中包括基于内容的推荐算法、基于用户的协同过滤推荐算法和基于项目关联和内容相似的混合推荐算法。在基于用户的协同过滤推荐算法中,对不同相似度度量方法进行了对比,最后采用扩展的余弦相似度计算用户之间的相似度,提高了推荐效果。在基于内容的推荐算法中,采用加权余弦相似度计算用户和视频之间的相似度,通过对权重进行优化,提高了推荐效果。基于项目关联和内容相似的混合推荐算法综合考虑项目内容之间的相似度和关联度。其中,项目之间的相似度通过计算项目结构化数据之间的相似度得到;项目之间的关联度主要通过分析用户对项目的访问数据而得到。混合推荐算法需要将项目之间的相似度和关联度进行融合,来最终生成项目之间的混合相似度,在推荐阶段,将和用户历史数据中最相似的项目推荐给用户。在混合阶段,首先根据用户活跃度,将用户数据划分成活跃用户数据和不活跃用户数据。对于活跃用户,将基于内容的推荐算法和基于用户的协同过滤推荐算法的推荐结果进行混合,在保证推荐结果准确性的前提下解决新物品推荐问题。对于不活跃用户,则采用基于项目关联和内容相似的混合推荐算法。最后通过实验验证了混合策略的有效性。