论文部分内容阅读
伴随着电子商务的发展,人们的日常生活方式发生了巨大改变。现在我们可以通过电脑或手机等设备在足不出户的情况下购买到自己想要的商品。然而信息时代数据爆炸式增长为人们获取信息和知识带来更多机遇的同时,如何在海量数据中剔除不相干的信息、快捷地获取到有价值的信息成为一项挑战工作。而个性化推荐系统就是在这样的背景下产生的,它可以挖掘出不同用户的不同偏好,从而有针对性地进行个性化推荐。学术界对现有电子商务个性化推荐技术的研究主要集中在基于内容的、协同过滤的、基于知识的等传统推荐技术以及对这些算法的优化上,但是电子商务已经进入了大数据时代,优化的传统算法尽管在一定程度上可以提升推荐系统的效果,但是已经不能适应大数据环境下满足客户的个性化服务的需求。与此同时,目前很多学者对推荐系统评测指标认识不全面,有些学者及文章只局限于推荐系统的精确性这一个方面,而对多样性、新颖性、覆盖率等指标视而不见,还有些学者及文章在文中只选择对自己算法有利的指标,因此如何客观、有效的评价推荐系统需要一个完整统一的指标体系。在以上问题的基础上,本文设计了大数据环境下推荐系统的架构、基于云计算的推荐算法和分布式推荐系统综合评测体系,并且实现了基于云计算的电子商务智能推荐系统原型。主要工作如下:(1)基于云计算的推荐系统框架设计,研究了基于云计算的大数据处理技术、Hadoop平台以及MapReduce工作原理,提出了基于云计算的推荐系统总体框架与系统工作流程。(2)基于云计算的推荐算法设计,针对传统推荐算法在数据稀疏性及在大数据规模下系统可扩展性的问题,在分析研究Hadoop分布式平台与基于内容过滤、协同过滤、关联规则等相关算法后,提出基于Hadoop平台实现个性化推荐算法的方法。(3)分布式推荐系统综合评测体系设计,研究了分布式推荐系统评测体系设计的基本原则,并据此建立推荐系统评测指标体系,包括预测准确度、效率性、覆盖率、多样性、新颖性等五个维度,并且提出各指标的评价方法。(4)基于云计算的电子商务智能推荐原型系统实现,以电子商务网站海量行为数据为实证研究对象,构建基于Hadoop云平台电子商务智能推荐系统原型,并进行推荐系统评价指标实证研究,验证算法和指标的有效性,改进并丰富基于云计算的电子商务智能推荐系统的理论、方法和技术体系。通过研究基于云计算技术实现的电子商务智能推荐系统,解决了传统单机环境对各种推荐算法支持不足的问题,验证了分布式推荐系统评测指标体系的有效性,对改进电子商务个性化推荐系统的有效性、规模性和实时性,提升个性化精准营销水平具有重要的理论意义和经济价值。