科技论文推荐算法研究

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:ocean0228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,科技论文数量迅速增加。同时,越来越多的科研人员选择通过互联网寻找科技文献支持他们的前期调研工作。目前,人们一般通过谷歌学术、知网等学术文献检索平台找寻文献,也有很多为了解决信息过载问题的科技文献推荐平台应运而生。本文在对很多推荐算法进行调研和分析后,把科技文献相互引用而生成的引文网络作为切入点,提出了一种新颖的基于语言模型的科技论文推荐方法。本文主要包括以下三个方面的工作:(1)简要介绍了科技论文推荐的关键技术、语言模型与词向量的相关概念和应用,分析了引文网络的价值和应用,利用引文上下文和自然语言结构上的相似性,首次提出了引文语句的概念,将科技论文建模为引文语句中的单词,进而可以采用词向量模型来描述科技论文。(2)在引文语句的基础上,提出了 PaperLinkRank算法,利用神经网络语言模型工具word2vec训练引文语句并得到了模型。在通用的DBLP数据集和CiteSeer数据集上设计了仿真实验证明这一方法能够很好地完成推荐任务,并和其他推荐算法就覆盖率、排序精确度、平均倒数排名等指标进行了对比。实验结果表明基于引文网络的语言模型科技论文推荐系统有比较好的表现,与传统协同过滤方法相比较大提高了 F1指标,与PageRank等相比,在推荐列表长度一定时MMR提高15%左右,并且在多样性方面有更好的表现。(3)设计并实现了一个科研服务平台的推荐模块,重点研究个性化推荐的过程,隐式采集用户行为数据并对数据进行清理,分析了用户行为的重要程度来为数据分配权重。目前,系统收集了 300余万篇中外科技文献,已经开发完成并处于试用阶段。
其他文献
"游学"是最为传统的学习、教育方式之一。春秋战国时期,游学已成一时风气,经过汉到唐代的发展,到了宋、元、明、清已达到了鼎盛。到近代,游学深入发展为留学,将中国教育推向
本文概述了环境美学的含义及其艺术特征,阐述了环境美学与工业建筑设计之间的关系,对环境美学视野下的工业建筑设计进行了探讨,以供参考。
文章探讨了水库工程的管理养护措施,常见的问题和对策,以及加强防汛工作的措施。
根据GenBank中登录的植物肌动蛋白保守序列设计1对引物,对三叶青的块根进行RT-PCR,在1次扩增中得到2个不同的肌动蛋白基因片段,分别命名为ThAct1和ThAct2.测序结果显示:ThAct1
发展了一种高效温和的用2-萘酚氧化偶联合成取代的联萘酚的方法,采用5mol%CuCl,1.5mol%的氨基聚硅氧烷,可以高收率地得到各种取代的联萘酚.这个反应可以在室温下进行.
本文研究了利用微波辐射氯化钙再生的新工艺,并对影响氯化钙脱水率的因素进行了分析和讨论.
北京工业职业技术学院的“建筑施工技术”课程以施工全过程为导向,突出职业能力培养,在教学内容、教学方法手段、师资建设及实践教学等各方面都进行了深入的研究和探索,根据国家
制备了3种双(二甲基硅基)取代的含硅单体化合物,即1,4-双(二甲基硅基)苯、4,4′-双(二甲基硅基)联苯、9,10-双(二甲基硅基)蒽,并将上述化合物分别与4,4′-双(乙炔基)联苯在RhCl(PPh3)3/Na
对硫酸生产过程中产生的废渣进行磁化焙烧试验,确定了工艺过程及工艺参数,为利用硫铁矿烧渣生产化工产品提供了条件.
当前,我国医疗问题主要表现在以下几个方面:人均医疗费用支出激增,且增长速度已经超过了很多家庭收入的增长速度;人口老龄化来临,对现阶段的医疗体制造成了重大的冲击;全面医疗保险