论文部分内容阅读
互联网的产生使得电子商务得到了前所未有的发展,伴随而来的是商品数目与种类的爆炸式增长。在这种背景下,用户在繁杂的信息中需要花费大量的时间和精力来寻找自己想要的商品,与此同时不同的用户有自己独特的需求。针对此类问题,初期传统的互联网企业有两种解决方案,一是采用分类目录;二是搜索引擎。但是两者有一个共同的局限:需要用户主动提出自己的需求。但是有时候用户无法十分确切描述出自己的需求,为了帮助用户快捷准确的锁定自己感兴趣的物品或信息,个性化推荐系统应运而生。其利用数据挖掘技术,具有高度智能化,能够为用户提供完全个性化的决策支持和信息服务。推荐系统要想使用户获得良好的体验度,作为其核心的推荐算法的重要性不言而喻。目前实际生产中最常用的推荐算法要数协同过滤推荐算法,所谓协同过滤算法就是抓住用户选择商品这一本质,利用用户与商品间的关系,分析用户兴趣,挖掘不同用户之间的相似性或者不同物品之间的相似性,通过各种不同的计算方法形成用户对未知商品的喜好程度的预测。本文所作的主要工作有:1.详细阐述了课题的研究背景,国内外的发展历史及研究现状。2.对推荐系统相关的主要技术进行了详细的阐述,其中重点分析推荐引擎的分类及评测标准。3.利用mahout协同过滤开发模型实现了几种推荐算法的组合,并在Amazon图书数据集上进行了评估、算法的人工验证和手动调优。本文的主要创新点:1.在深入剖析mahout协同过滤算法框架的基础上,对系统实现过程和推荐结果以及对结果的评测进行了跟踪、分析。2.采用限定用户属性的方法优化推荐过程,使推荐结果更加合理,准确。本文通过在Amazon图书数据集上进行的组合算法的实现表明:在数据集比较小的情况下,推荐的结果并不理想;通过限定用户属性的方法,可以使预测结果的均方根误差明显减小,算法更加稳定。本文的工作对推荐系统的实际应用有一定的参考价值。