论文部分内容阅读
在竞争不断加剧的背景下,电子商务网站不断利用个性化推荐技术提高新用户的兴趣和老用户的忠诚度。协同过滤(CF)作为推荐系统中最成功的一项技术,它的能力已经在不同的电子商务系统中得到了验证。然而,传统CF遇到一些棘手的问题如冷启动问题、数据的稀疏性问题、推荐的可靠性问题等需要有效的解决办法。特别是CF在处理交互性强、需要专门技能知识的领域,更显得力不从心。为解决上述问题,研究者已提出了CF与基于内容过滤结合的混合推荐技术。但是,基于内容过滤需要提取这些产品种类的许多特征,这个工作是非常困难的。本文正是在这种背景下,为了解决协同过滤算法中遇到的数据稀疏性、针对具有专门知识背景的项目推荐,提出基于双信息源模式的协同过滤算法。作者首先从电子商务的推荐系统入手,阅读了国内外大量相关资料,概述了电子商务中推荐系统的作用和应用实例;给出电子商务推荐系统的模型,并介绍了推荐系统中的输入数据的种类及其特征;对电子商务中的推荐系统的分类和应用的典型技术做了较为深入的研究。其二,对协同过滤的推荐算法进行研究分析,说明协同过滤算法的工作原理和算法的输入输出;对普遍应用的两种协同过滤算法—基于用户的协同过滤推荐算法和基于项目的协同过滤推荐算法,进行了介绍;重点讨论了传统的协同过滤算法存在的问题,并分析了当前提出的解决方法,指出它们的优势和不足之处。其三,详细介绍本文提出的基于双信息源模式的协同过滤算法,该方法将判断活动用户对目标项目的兴趣程度建立在两个推荐组——相似用户推荐组(最近邻居集合)与专家推荐组基础上,把两个推荐组的建议结合起来,形成可靠的信息源,然后,分析各自影响活动用户对目标项目的权重,计算活动用户的最终兴趣度,实现系统推荐。基于双信息源模式的协同过滤算法(DISCF)充分考虑电子商务中个性化服务的实际情况,使推荐系统建立在更可靠的信息源基础上,仿真试验证明该方法有更好的推荐质量。