论文部分内容阅读
在互联网的许多应用场景中,用户需要面对海量的信息。无论这些信息对于用户而言是熟悉或不了解,人们都希望可以迅速的从中得到有用的个性化的信息。推荐系统是解决这个问题的方法之一,它根据用户的访问或行为历史数据,过滤用户不需要的信息,推荐最符合用户需求的个性化信息。电子商务是推荐系统在互联网最为典型的应用领域之一。推荐系统在电子商务中扮演销售人员的角色,为用户提供建议,帮助用户更好的做出购物选择。推荐算法是推荐系统中的关键技术。它根据用户的特征信息、历史行为信息和物品的特征信息,结合一些额外的策略,预测用户对物品的评分、喜爱程度或个性化地为每个用户推荐物品。其中,协同过滤(collaborative filtering)算法是目前主流的推荐算法。尽管目前协同过滤技术在互联网推荐系统中已经有很多成功的应用例子,但是随着互联网技术的发展,以及页面信息量和用户量的与日俱增,协同过滤推荐算法面临着以下两个问题:1)利用用户和物品的可用信息提高推荐结果的准确率。除了评分和访问信息外,用户和物品还有特征信息,例如用户有人口统计学信息而物品会有形状、属性和访问时间等信息。如何使用这些可用信息产生更准确的推荐。2)用户兴趣随时间推移而变化的问题。随着时间的推移,用户的兴趣是会不断地变化的。如果推荐系统不能及时捕捉用户兴趣的变化,那么其产生的推荐结果就有可能偏离用户需求。针对上述问题,本文在分析研究前人工作的基础上,提出一种基于时间权重的最近邻协同过滤算法。算法在传统最近邻协同过滤算法的基础上,引入时间权重。通常,物品的可用信息包括物品被用户访问的时间,基于访问时间信息构造时间权重函数。直观地,用户兴趣的变化是与时间相关的,因此时间权重能够在某种程度上反映变化情况。提出了基于指数时间权重的最近邻协同过滤算法和基于对数时间权重的最近邻协同过滤算法,以推荐准确率为评价指标,设计了基于二元评分数据集的实验对算法进行评价。结果表明,对数时间权重与基于用户的最近邻协同过滤算法结合效果最好,与传统最近邻协同过滤算法相比准确率有所提高。