论文部分内容阅读
个性化推荐系统作为一种常见的信息过滤手段,能够在“信息过载”环境下通过分析用户和物品之间的历史交互数据,建立用户兴趣模型,从而发现用户感兴趣的信息并将这些信息推荐给用户,传统的推荐系统主要分析用户-物品二元关系来生成推荐结果,没有考虑上下文信息对推荐系统性能的影响。近年来,随着互联网、社交网络和社会化标注系统的快速兴起,互联网中产生了大量和用户兴趣相关的上下文信息,例如反映用户之间兴趣关系的社交网络数据、反映用户兴趣的标签数据以及描述用户兴趣变化的时间数据等,很多学者研究使用这些上下文信息来改进推荐系统的性能,主要包含使用社交关系上下文信息的社会化推荐,基于标签或时间上下文的推荐等问题。但在这些领域中,还存在很多问题亟待解决。本文基于大量公开的反映用户兴趣的上下文数据和用户行为数据信息,从人和人上下文信息(社交关系)、人和环境上下文信息(标签、时间等)对推荐系统性能的影响两大方面进行了深入的研究,设计并提出了一系列新的算法和模型,这些算法和模型中融合了相应的上下文信息用来改进推荐系统的推荐准确度,包括社会化推荐中用户间社交关系数据缺失问题,社会化推荐中用户兴趣融合问题,评分预测中的用户熟悉度感知问题,以及一个上下文感知通用推荐系统模型。本文的主要工作和贡献如下:1.隐社会化推荐:在社会化推荐中,需利用系统中用户间的显式社交网络关系来进行推荐,然而,在现实中大多数的推荐系统无法得到用户间显式社交网络关系,针对这个问题,本文提出了一种隐社会化推荐模型:ISRec (Implicit Social Recommendation),首先利用系统中用户-物品二元关系来构造用户之间隐含社交关系,同时将这一思想加以扩展,构造了物品间隐含的社交关系,通过改进的概率矩阵分解模型(Probabilistic Matrix Factorization ,PMF)将构造的隐社交关系同时融合到推荐过程中去,在推荐的过程中实现多关系同时学习。该方法解决了在无法得到用户间显式社交网络情况下,如何进行社会化推荐的问题,扩展了社会化推荐的使用范围,同时复杂度分析表明模型的计算复杂度和系统中可观测数据呈线性关系。实验结果表明,该方法能够显著的提高评分预测的准确度,并且在一定程度上缓解了数据稀疏性问题。(第三章,学术论文成果[1])2.融入用户兴趣的社会化推荐:不以用户间共同兴趣形成的社交关系在社会化推荐中会影响推荐结果的准确度。针对这个问题,本文提出了一个融合用户兴趣的社会化推荐模型UISoRec (User Interest-fused Social Recommendation),该方法首先利用系统中用户之间的兴趣关系构建用户的兴趣特征向量,并用该特征向量来改进社会化推荐中用户的潜在特征向量,使得系统进行推荐时,在使用社交关系时的同时衡量用户之间的兴趣是否相似。实验结果表明,UISoRec模型显著的改进了社会化推荐方法的推荐准确度,同时也验证了兴趣社交关系在推荐中的积极作用。(第四章,学术论文成果[3])3.用户熟悉度感知推荐:在推荐系统中,用户对物品的熟悉程度决定了用户给出的评分在推荐中的价值,某个物品不同用户的评分在推荐中应有不同的推荐权重。针对用户对物品熟悉度这个上下文信息,本文提出了一个用户熟悉度感知推荐系统UFD-RS(User-Familiarity Degree aware Recommender System),该方法首先利用标签信息来对用户熟悉度进行建模,得到每个用户对每个物品的熟悉度,然后基于概率矩阵分解模型提出了一个能够融入熟悉度信息的推荐模型,该模型在推荐过程中对每个评分添加了一个基于用户熟悉度的推荐权重,从而实现更加精确的推荐。实验结果表明,用户熟悉度感知算法较协同过滤中性能最好的SVD算法和PMF算法在预测精确度上分别提高了 19.7%和11.01%,同时还验证了熟悉度上下文信息对推荐过程的显著影响。(第五章,学术论文成果[2])4.评分上下文感知通用推荐模型:目前,在大多数的推荐系统中,仅仅依靠用户-物品评分关系来分析用户的喜好并给出推荐,没有考虑评分所处的上下文环境(如时间、位置、情绪、了解度、社交信息等),针对这个问题,本文提出了一个评分上下文感知通用推荐模型 GRCARS (General Rating Context-Aware Recommender System),该模型能够将评分的上下文信息融合在用户偏好的提取过程之中,并且算法简单通用,能够适用于多种上下文信息情形。同时本文还给出了两个基于评分上下文感知通用推荐模型的具体推荐方法:时间上下文感知推荐模型tRCARS和了解度上下文感知推荐模型uRCARS。试验结果表明,融合了评分上下文信息后,评分预测的准确度显著提高,tRCARS算法评分预测RMSE的准确度比SVD算法和PMF算法分别提高了 22.88%和10.71%,uRCARS算法的预测RMSE准确度比SVD算法和PMF算法提高了 23.16%和11.03%。(第六章,学术论文成果[4])