论文部分内容阅读
挖掘用户的兴趣偏好是推荐的核心和基础,一般的推荐算法仅通过用户对项目的评分获取用户的兴趣偏好。随着Web 2.0的发展,社会化标注系统的出现使得用户可以对任何项目添加自己喜欢的标签,标签作为一种情境信息反映了用户对项目的看法以及兴趣,而且标注频次和标注时序的动态变化同时影响着用户兴趣的刻画。因此本文结合国家自然科学基金项目“泛在计算环境中社会化驱动的情境感知个性化信息服务研究”(项目编号:71471165),研究了结合标注情境与评分的推荐方法,系统地阐述了结合标注情境与评分的推荐模型的构建方法,提出了基于标注频次的相关性指标和基于时序性的关联强度指标来挖掘用户的潜在兴趣并展开实验研究。本文的主要工作和贡献如下:(1)构建用户、项目、标注情境的基础关系模型。通过用户标注行为将用户-项目-标注情境三维关系降维成用户-标注情境和标注情境-项目二维关系,通过用户评分行为建立用户-项目二维关系,直观地表现了推荐系统中三者的关系。(2)建立标注情境关联指标。利用Logistic人口增长模型构建相关性指标,将标注频次转换为相关性强度。根据用户标注行为的时序性,利用时间遗忘曲线,构建关联强度指标。通过这两个关联指标刻画用户的兴趣偏好。(3)提出标注情境与评分的推荐方法。根据用户评分行为的时序性,将评分通过关联强度指标转换,然后通过用户、标注情境、项目三者之间的紧密关系构建推荐模型。得到任意标注情境下用户对项目的预估评分,从而生成推荐列表。(4)开展实证研究及分析。本文选取具有代表性的社会化标注应用平台Movielens的标注数据和评分数据作为研究数据集,利用准确率、召回率和F1值三个评价指标分别对考虑不同关联指标的模型进行评估与对比。研究表明,结合标注情境和评分的推荐方法效果优于一般仅考虑评分的推荐方法;标注频次不能直接代表用户与标签以及标签与项目之间的紧密程度,仅考虑相关性指标得到的推荐效果最好;用户的评分行为较为稳定,几乎不随时间的变化而变化;用户的标注行为受时间因素影响大于评分行为受时间因素影响。研究结果对于推荐具有较高的实践应用价值。