论文部分内容阅读
推荐系统是解决当前信息过载问题的有效途径,是电子商务领域的一项重要研究内容,旨在为用户和企业都带来利益,具有良好的发展前景。分析比较了当前广泛使用的各种基于规则的推荐系统、基于内容的推荐系统、协同过滤推荐系统以及混合推荐系统,讨论了电子商务推荐系统的四大研究内容、协同过滤算法在推荐系统中的应用、复杂网络理论及其统计特征量在推荐系统中的应用。针对当前主流的协同过滤推荐算法所存在的评分数据稀疏性、冷启动和可扩展性问题,在推荐系统中引入了复杂网络的思想,即忽略用户和商品项目的内容特征,仅仅把它们视作为抽象的节点,用复杂网络的各种统计特征来描述推荐系统中用户或商品项目间存在的各种关联。以Movielens数据集为载体,实现了基于二部分图网络的推荐算法。以电影推荐系统为例,把用户和电影看成是二部分图网络中两类不同的节点,以及如何根据二部分图网络的资源分配原理推导出推荐算法。实验数据证明:基于二部分图网络结构的推荐算法在推荐准确率上超越了经典的协同过滤推荐算法,并且有助于解决协同过滤系统中的冷启动问题,有益于对冷门商品的推荐。在复杂网络理论基础上,提出了一种新颖的基于用户关联网络的推荐算法,并以Movielens数据集为载体进行了实验,实验证明:算法有效。在这部分的工作中,仍然以电影推荐系统为例,首先,根据用户选择相同电影的数量和评价信息构造出用户之间的关联网络,用户间的关联程度用权值衡量。然后,在已构造出的用户关联网络中,根据某部电影被所有用户选择的记录,将该部电影推荐给与这些用户连接权值较大的其他用户。实现了在复杂网络中对电影的推荐,即挖掘出了对该部电影潜在感兴趣的用户。实验结果表明:基于用户关联网络的推荐算法,其推荐准确率受到用户间连接权值的影响,在产生的推荐结果中,所呈现的用户和电影链接都是在原始数据中不存在的,挖掘出这样的链接对于数据挖掘来说是极为重要的,即便是较小的准确率,在商业应用中也是值得的,仍然具备商业价值。