基于学术网络的新论文影响力预测

来源 :山东大学 | 被引量 : 0次 | 上传用户:slzj118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,论文发表数量呈现指数型增长趋势。从海量论文集中,挖掘新论文的潜在影响力、发现高质量的新论文不仅能够有效帮助研究人员快速地挑选新论文,而且帮助研究人员了解领域技术的最新动态。然而高引论文所占比例较低,论文影响力存在差异,而且新论文在发表时期没有任何引用记录,基于论文引用数量的传统方法不能衡量新论文影响力或者评价新论文质量。因此挖掘新论文的潜在影响力、发现高质量新论文是一个具有挑战性的问题。为解决新论文影响力预测问题,本文将作者、论文作为节点,以作者与作者的合作关系、论文与论文之间的引用关系以及作者与论文之间的从属关系作为边,构建学术网络。本文基于学术网络预测新论文影响力,主要解决两方面的挑战:论文库的不断更新导致主题的动态演变、时间敏感的主题关注度变动以及作者主题相关权威性的波动;多因素对论文影响力的联合影响。针对主题的动态演变、时间敏感的主题关注度变动以及作者主题相关权威性的变动的挑战,本文首先引入了动态主题模型。该模型拓展了传统的状态空间模型,学习每个主题-词的概率分布随时间的演变过程;然后本文依据动态主题模型学习所得的主题概率分布衡量主题在不同时期的关注度;最后本文基于论文之间引用关系,使用PageRank算法计算论文潜在影响力,并结合论文动态主题的概率分布,获得论文作者主题相关权威性的特征向量。本文结合作者在不同主题上的权威的特征向量以及新论文的主题概率分布,利用向量叉积原理,衡量作者主题相关的权威性如何作用于不同主题分布的新论文。针对多因素对论文影响力的联合影响的挑战,本文从作者之间、研究团体内部以及研究团体之间分析作者相关的社交因素。此外本文还分析了论文发表的会议或者期刊的权威性特征。本文利用因式分解机模型,联合分析各类特征对新论文影响力预测的影响。因式分解机模型对新论文每一特征维度,使用潜在向量进行表示,并利用随机梯度下降算法,学习潜在向量。通过使用向量点积表示特征之间潜在关联关系,并且利用学习所得的潜在向量,对新论文影响力进行预测。本文使用从ACM电子图书馆爬取的数据集,首先对新论文影响力的预测结果以及论文影响力排名进行验证,并且和其他论文影响力预测方法进行对比。实验结果表明本文方法的有效性。其次对时间敏感的主题关注度、作者主题相关的权威性以及作者社交性对新论文在不同时间的影响进行研究。此外本文设计实现基于移动设备的IPS(Influence Prediction System)系统,实现论文主题概率分布以及影响力预测结果的展示以及作者主题相关的权威性排名等。此外本文对IPS系统进行相关的功能测试和性能测试,测试结果表明系统能够正常运行。
其他文献
动画是一个博大的世界,虽然是虚拟的,却包容万象。它是集文学、绘画、音乐、电影等多种艺术为一体的综合性艺术。动画电影审美体验是哲学、心理学、社会学等学科研究的重要课
个体对于自身身份认同的定位是模糊的,但若将其放入群体中,其对自身身份属性就产生了探寻和定位,最终通过最基本的国家认同、民族认同、文化认同等形成对自身身份属性的认同
脑梗塞一直是神经科最为常见的疾病,其病死率及致残率特别高.到目前为止没有特别好的治疗方法,近年来提倡的急性期溶栓疗法,因其选择适应证较为严格也不能广为推广.目前我院