基于ResearchGate的科研合作者推荐研究与实现

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:din6688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网应用技术的飞速发展,如今社交网络已经成为我们学习生活中一个重要的组成部分,用户通过社交网站,既可以浏览自己感兴趣的信息也可以发布自己编辑的信息。跟传统的社交平台Twitter类似,ResearchGate是一个社交网络服务网站,其为全世界的科研工作者提供了一个科研成果和学术分享平台,用户可以在ResearchGate上关注感兴趣的其他用户,也可以跟其他用户进行学术交流。因此,在这种学术环境中,如果能够帮助学生找到研究相关领域的导师或者帮助其他研究人员找到研究兴趣相同的同行,将会是非常有意义的。本文在已有研究的基础上,研究利用科研人员所发表的论文文本数据等信息构建用户兴趣模型并搭建科研合作者推荐系统:(1)在处理论文文本数据过程中,针对直接将隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型应用到文本数据中主题特征向量表述能力不足的问题,本文在文本特征筛选和主题特征扩展方面进行了深入研究,通过引入外部知识库维基百科,构建基于维基百科类别的词条特征表和LDA主题模型,分别用于对文本特征进行筛选和主题特征扩展,构建了基于维基百科的主题特征扩展模型,提高了文本主题特征向量的表现能力。并且在20newsgroup和NSF Research Awards Abstracts 1990-2003数据集上进行了验证试验,通过比较,证明了本文构建的主题特征扩展模型在表示文本特征上的有效性。(2)实现一个可用的科研合作者推荐系统。本文通过编写网络爬虫程序爬取Research Gate上的数据来获取用户信息,并探讨了网络爬虫的相关技术问题及解决方案。然后利用科研人员所发表的论文文本和关注关系等信息,基于主题特征扩展模型构建用户兴趣模型。最后利用所构建的用户兴趣模型,搭建了一个科研合作者推荐系统:针对学生,该合作者推荐系统可以用于推荐导师,针对其他科研人员,该推荐系统可以用于推荐相关同行。
其他文献
随着大数据与移动互联时代的到来,数据呈爆发式的增长,海量的异构化数据相互交织,数据可视化已成为数据挖掘和数据分析过程中的重要技术。图表作为数据可视化的利器,一直被广
频率选择表面(Frequency Selective Surface,FSS)是由周期阵列结构排列而成的无限大平面结构,它可以根据需要对入射电磁波实现选择性传播。该结构在电磁波技术的诸多方面得到
随着国家城市化的快速发展,越来越多的人们离开乡镇到县城买房,孩子也随家长迁徙到县城,使得县城初中学生人数不断增加。笔者所在的学校是地处江苏苏北响水的一所初级中学。
步态是人走路时所表现出来的姿态,是一种复杂的运动过程。步态识别技术是一种新兴的生物识别技术,通过对人体行走方式进行客观地记录并对其进行有效的评估及分析,旨在通过生
无线传感器网络(Wireless Sensor Network,WSN)作为物联网的神经末端,负责对现实物理世界进行信息监测,随着物联网的发展其作用日益凸显,被认为是21世纪最重要的通信技术之一
随着移动互联网的发展,移动端应用程序呈现爆炸式增长。Android作为一个开源操作系统被大量手机厂商定制化使用,也正是由于其开放的特点,导致Android应用市场中涌现出大量恶
无线协作通信在抵抗多径衰落以及提高系统传输速率方面具有明显的优势,在不增加硬件成本的同时获得相应的分集增益,但存在频谱利用率较低的缺点。将网络编码引入无线协作通信
澳大利亚高校招生制度又被称为ATAR招生制度,因为澳大利亚高校准入排名(ATAR)是判断入学资格的主要标准。2009年,当时的教育部部长茱莉亚·吉拉德(后为2010至2012年的澳大利
近年来,随着精确制导武器的发展,多模复合制导体制已经成为了研究的热点。采用极化敏感天线阵列,能够使被动测向系统兼容其他制导模式的探测传感器。极化敏感天线阵列可以同
迅速发展的云计算技术与大数据技术使得互联网承载着越来越多的应用业务,数据规模大幅扩增,尽力而为的传统网络服务根本满足不了广大用户的需求。包分类技术是下一代互联网络