论文部分内容阅读
论文推荐系统通过分析大量的文本信息和用户的行为信息,挖掘用户的潜在需求,在海量的文档中为用户推荐感兴趣的论文,节省了读者的搜索时间。本文构建一种基于排序主题模型的论文推荐系统,在保证推荐结果准确的前提下,有效提高推荐的惊喜度,帮助用户发现有用的相关论文。首先将文章抽象成不同的主题,通过对主题之间的关系度量来判断文章之间的相似性;针对主题重要性度量问题,本文引入众包策略,通过微信公众平台将论文推荐系统应用于微信手机客户端,收集用户对推荐结果惊喜度的评分,将用户的评分反馈给系统并调整不同主题的权重,最终得到一个参考了用户感受的排序的主题列表。通过与未排序的主题模型和没有用户反馈的推荐结果的实验对比,证明了排序主题模型可以有效提高推荐系统的惊喜度。文章主要工作包括以下三个方面:1.基于主题模型的论文推荐。采用LDA主题模型训练语料库,将文档映射到主题上,通过判断主题之间的相似性来为用户推荐可能感兴趣的论文。2.推荐结果的惊喜度评价。通过模型的验证,本文提出一种对论文推荐系统惊喜度的评价方法。将惊喜度定义为新颖性和相关性的总和,新颖性通过论文的流行度计算,相关性则通过论文之间的相似性计算。3.采用众包策略收集用户的评分反馈。反馈分为基于微信用户的单级反馈和基于专家评分的多级反馈,基于微信的众包策略可以很方便地获取用户的评价,通过用户的主观反馈来调整不同主题的权重,人为反馈信息更符合用户对推荐结果惊喜度的需求。但是微信好友的反馈可能存在不准确性和随机性,为了验证反馈对推荐结果的作用,本文加入了多级反馈策略,选取特定用户对推荐结果的多次反馈来调整不同主题的权重。