基于排序主题模型的论文推荐系统

来源 :大连海事大学 | 被引量 : 6次 | 上传用户:wangcong1001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文推荐系统通过分析大量的文本信息和用户的行为信息,挖掘用户的潜在需求,在海量的文档中为用户推荐感兴趣的论文,节省了读者的搜索时间。本文构建一种基于排序主题模型的论文推荐系统,在保证推荐结果准确的前提下,有效提高推荐的惊喜度,帮助用户发现有用的相关论文。首先将文章抽象成不同的主题,通过对主题之间的关系度量来判断文章之间的相似性;针对主题重要性度量问题,本文引入众包策略,通过微信公众平台将论文推荐系统应用于微信手机客户端,收集用户对推荐结果惊喜度的评分,将用户的评分反馈给系统并调整不同主题的权重,最终得到一个参考了用户感受的排序的主题列表。通过与未排序的主题模型和没有用户反馈的推荐结果的实验对比,证明了排序主题模型可以有效提高推荐系统的惊喜度。文章主要工作包括以下三个方面:1.基于主题模型的论文推荐。采用LDA主题模型训练语料库,将文档映射到主题上,通过判断主题之间的相似性来为用户推荐可能感兴趣的论文。2.推荐结果的惊喜度评价。通过模型的验证,本文提出一种对论文推荐系统惊喜度的评价方法。将惊喜度定义为新颖性和相关性的总和,新颖性通过论文的流行度计算,相关性则通过论文之间的相似性计算。3.采用众包策略收集用户的评分反馈。反馈分为基于微信用户的单级反馈和基于专家评分的多级反馈,基于微信的众包策略可以很方便地获取用户的评价,通过用户的主观反馈来调整不同主题的权重,人为反馈信息更符合用户对推荐结果惊喜度的需求。但是微信好友的反馈可能存在不准确性和随机性,为了验证反馈对推荐结果的作用,本文加入了多级反馈策略,选取特定用户对推荐结果的多次反馈来调整不同主题的权重。
其他文献
随着计算机的普及和互联网的迅猛发展,Web上形成了大量的电子化文档,其中蕴涵着诸多可用的信息。因此,在信息抽取技术(Information Extraction:IE)发展基础上的Web信息抽取成为近
随着计算机时代的飞速发展,人们越来越追求工业的智能化,于是人机结合和交互愈发的得到重用。作为仅次于语言的交流方式,人们通过手势能够完成对机器的指令引导工作,基于人体手势
学位
随着“雾霾”二字近几年在国内乃至国际热门话题中频繁出现,人们意识到一味追求工业飞速发展虽然暂时带来了社会的快速进步,但也要为此付出巨大的代价,而城市空气污染则是其中最
入侵检测作为一种主动防御技术,弥补了传统安全技术的不足。本文在对已有的入侵检测模型研究的基础上,提出了一个多代理的入侵检测模型,该模型中各代理之间的通信方法可以适
随着人们生产和搜集数据的能力大幅度提高,迫切需要找到从现有数据库系统/广域网的大量数据中提取知识的手段。然而,目前人们分析数据、获取知识的能力还不能与现有的组织、
RFID(Radio Frequency Identification)技术是从二十世纪八十年代兴起的一项非接触式自动识别技术。由于RFID技术有着优良的性能,现在它被广泛应用于车辆管理系统中,但是在应
无线传感器网络是由大量随机分布在监控区域内的传感器节点通过无线通信方式形成的多跳自组织网络系统。传感器节点消耗能量的模块包括传感器模块、处理器模块和无线通信模块
近年来,随着信息社会的高速发展,计算机考试系统已经逐步代替传统的考试,计算机考试系统正以其特有的优势在现代教育中扮演着重要的角色,能否利用考试系统对被检测者进行有效
随着计算机工业突飞猛进的发展以及人工智能、并行处理和神经网络的发展,计算机视觉技术的实用化和复杂机器视觉过程取得了长足的发展。目前,机器视觉正被广泛的用于视觉检测