论文部分内容阅读
当今数据爆炸式增长造成了严重的信息过载问题,如何从海量的数据中快速获取用户需要的有效信息,已经成为当今数据挖掘领域的热点研究问题。个性化推荐技术能根据用户历史行为挖掘用户的兴趣爱好,为目标用户提供个性化的推荐服务,是解决信息过载问题的重要技术之一。个性化推荐技术主要功能包括评分预测和Top-N推荐,其中Top-N推荐通过预测用户对项目的喜好度,被认为更符合用户兴趣推荐的应用需要。基于协同过滤的Top-N推荐算法被广泛应用,其中稀疏线性推荐算法(Sparse Linear Method,SLIM)是协同过滤推荐算法中对基于项目推荐算法的推广,具备快速且高效推荐的优点,但是依然存在数据稀疏性问题、推荐多样性和新颖性问题、以及用户兴趣漂移等问题。针对这些问题,本文采用Top-N推荐方式提出了基于时序行为和专家意见的稀疏线性推荐算法。本文的主要工作包括:(1)针对推荐系统中存在的推荐新颖性问题,本文提出了基于双因子惩罚的稀疏线性推荐算法。该算法在SLIM算法模型中引入了用户活跃度惩罚和项目流行度惩罚,通过用户活跃度惩罚因子修正项目相似度计算,通过项目流行度惩罚因子缓解推荐系统中存在的长尾效应,提高推荐质量和推荐新颖度。(2)针对推荐系统中存在的用户兴趣漂移问题,本文提出了基于时序行为的稀疏线性推荐算法。该算法在基于双因子惩罚的稀疏线性推荐算法中引入时间权重,以捕捉在时间推进过程中用户兴趣所发生的变化,提高推荐准确性。(3)针对推荐系统中存在的数据稀疏性问题,本文提出了基于专家意见的稀疏线性推荐算法。该算法在SLIM模型中考虑了专家意见对用户推荐的影响,设计了一种新型专家意见的计算方式,通过借鉴专家意见,提高推荐准确度。通过在不同大小、不同稀疏性的多个数据集上的对比实验结果表明,本文提出的算法相较于现有方法具备更高的推荐准确率和项目推荐的新颖度,有效地缓解了个性化推荐算法中的推荐新颖性问题、用户兴趣漂移问题、数据稀疏性等问题。