论文部分内容阅读
随着数字学术资源数量的迅速增长,学生和研究者们越来越难以在浩如烟海的学术资源库中找到自己期望的资源。推荐系统是个性化搜索引擎外另一种有效的资源过滤手段。推荐系统根据用户的个性化的意图、兴趣,从海量的信息中选取与其兴趣相吻合的信息,并主动地推送给用户。尽管传统的协同过滤算法及基于内容的推荐算法在实际中得到了广泛应用并有着不错的表现,但这些算法并不能充分考虑与利用每个用户在资源的相似度,权威度,流行度,以及新鲜度等特性的独特需要,从而难以产生理想的个性化推荐结果。 本文提出了一种基于效用的个性化学术资源推荐算法。效用的概念是对每个对象的一个或多个属性指标的综合度量。效用函数建立了对象的各个属性对用户的“有用性”的映射关系。基于效用的个性化推荐方法的核心是为每个用户构建一个能够涵盖对象的全部特征的、并能使用户满意程度最大化的函数。然后,向用户推荐总效用值最高的对象。首先,本文提出了一种基于二元向量模型的建模方法,通过ALVectors,表现多样化的学术资源的客观效用;通过AUVectors,表现用户对学术资源在不同效用上的主观偏好。然后,提出了一个新的针对学术资源的个性化推荐算法,该算法能够结合ALVectors与AUVecoters,充分的考虑与利用了用户对于学术资源在内容与非内容上特性的偏好进行推荐,即采用VIKOR算法来获得综合所有效用的最优的推荐排序结果。最后,本文提出了用熵值法考察用户对于效用偏好的稳定性,并将其用于优化用户主观偏好提取与更新的方法。 本文实现了一个基于上述方法的个性化学术资源推荐系统,其主要由网络爬虫模块,预处理模块,信息检索模块,推荐系统模块,以及web前端模块等部分组成。系统的学术资源数据由爬虫在公众学术数据库爬取后进行预处理,加载到系统中。然后,用户可以通过web前端进行关键词检索、查看、评分等操作,系统会自动为用户的行为进行个性化建模,并以此进行基于效用的学术推荐。 最后,本文与传统算法进行了对比实验。基于效用的个性化学术资源推荐系统在推荐结果的准确度与NDCG指标上均优于传统的基于内容的推荐算法,验证了该算法可以更好的满足用户的在学术资源上多维度的个性化偏好。