论文部分内容阅读
互联网的高速发展使其承载信息呈现爆炸式增长,人们在面对海量信息时往往会陷入不知如何选择的困境,推荐系统(Recommed System)由此产生。推荐系统能够根据用户的历史行为数据,向用户推荐感兴趣的物品。同时,用户的兴趣是不断变化的,这就要求推荐系统具有动态性。传统的推荐算法大多基于协同过滤,对具体用户的兴趣模型没有充分考虑,不能动态预测用户兴趣的变化。本论文深入分析了用户行为与用户兴趣的关系,研究了推荐系统的动态性以及基于用户行为的动态推荐模型,设计了基于Hadoop的微博推荐系统原型。论文主要工作如下:1、深入分析推荐系统的动态性,研究用户行为与兴趣之间的关系。通过对用户行为进行分类,重点分析和研究目前主要的互联网行为,包括浏览行为、评论行为、评分行为;通过分析浏览行为,提出并改进基于PV的浏览行为兴趣模型,并对模型进行了实验仿真;通过分析评论行为中所包含的用户情感,建立情感与评分的回归模型;通过分析由用户评分高低与其所表达的用户兴趣爱好程度大小之间的关系,提出了一种模糊兴趣分类方法。2、利用用户行为与用户兴趣的关系,根据电容充放电原理,提出了推荐系统中用户的兴趣压、兴趣阻以及兴趣流等概念,并由此建立一种基于兴趣流的动态推荐模型。同时研究该模型在单用户、多用户、动态多用户情况下,该模型的具体计算过程和实现方式。采用Movielens视频网站的实验数据,分析用户在观看电影过程中兴趣爱好的变化并对其量化,建立用户的兴趣爱好模型,向用户推荐用户感兴趣的电影;通过分析用户浏览网页的日志数据,向用户推荐N个用户感兴趣的网站;最后,通过仿真相关实验进行对比分析和评估模型。3、设计了基于Hadoop的微博推荐系统原型。对原型系统架构和系统主要模块进行了详细设计,并分析了各模块的具体功能。系统的主要架构包括云计算层、数据挖掘层和云服务层;系统的主要模块包括云计算模块,推荐模块,用户模块,并设计了系统类图,实现了微博推荐,最后通过了相关的测试。