论文部分内容阅读
随着web2.0时代的来临,人们可以从互联网上获取大量的信息。但与此同时也面临着信息过载的问题。传统的信息检索已经不能满足用户对于信息获取的需求,信息检索领域急需个性化推荐算法使人们从被动的搜索用户变为主动的浏览用户。现在广泛应用于推荐领域的算法是协同过滤算法,该算法基于用户的历史数据,将相似用户喜好的物品推荐给当前用户。但该算法往往难以得到令人满意的推荐结果,原因在于算法只考虑了推荐系统中的两个实体,即用户和商品。实际上,除了用户和商品之外,还有许多如标签、时间、天气等其他因素会对推荐结果产生影响。我们将这些因素称为上下文,将上下文纳入推荐模型的构建中将会产生更加准确的推荐结果。本文提出了基于张量分解模型并加入时间上下文和社交信息的推荐算法(tensor reduction algorithm combined with time and social relationship,TRTS)。算法考虑了推荐系统中的五个维度,即用户、商品、标签、时间和社交关系。算法挖掘用户、商品和标签之间的潜在关系,完成对指定的<用户,商品>对象的标签推荐。本文首先向张量的构建过程中加入了时间因素,提出了基于张量分解模型并加入时间上下文的推荐算法(tensor reduction algorithm combined with time,TRT),TRT算法考虑了用户兴趣的动态变化,并在算法设计中更加重视用户最近的数据。除此之外,TRTS算法在TRT算法的基础上向张量模型中加入社交关系,挖掘用户的社交关系一方面可以提高算法的推荐准确率,另一方面可以降低数据的稀疏性。最后,本文将TRT算法和TRTS算法在两种真实数据集上与几种经典推荐算法进行比较,验证了算法在推荐准确率和推荐效率方面的优势。本文首先对当前推荐算法研究现状进行分析,确定使用张量模型为算法建模,结合现有算法的不足,向算法中分别加入了时间因素和社交关系上下文,进行设计和实现。然后,分别进行了推荐质量、运行效率和参数调整方面的实验,使用真实数据集验证了算法的优势。最后对作者在课题期间的工作进行总结,并提出了下一步研究方向。