学者信息挖掘关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:ww20080808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全球学术文献已经超过3亿篇,学术工作者也已达到1亿人,并按照每年13%-20%的增长率在增加。然而,这些学术信息中仅有大约3%的数据包含语义标注信息。语义缺失很大程度的影响了学术研究的效率和学术事业的发展。学术文献数量越大,研究人员越难以查全和查准,学术研究会出现重复和浪费。本文主要研究学者信息挖掘关键技术,重点研究了学者重名消歧和学者兴趣标签发现这两个关键任务。实现学者重名消歧可提高计算学者影响因子的准确度。实现学者兴趣标签发现,可提升检索速度,为用户推荐相关的学者和文章,降低获取信息成本。有效的处理这两个问题,可以解决目前学术搜索引擎检索速度慢、检索内容不全的问题。学者重名消歧任务就是将学术文献中名字相同但实际却不是同一人的学者予以区分。本文提出了一种基于网络表示学习的学者重名消歧模型。本文在目前最流行的三大数据集上进行实验,相比于目前效果最好的方法的Macro-F1值有5%-10%的提升。本文的模型将属性转换成网络节点之间的关系,所以可以轻松的扩展到其他多属性的网络中去。学者兴趣标签发现任务就是根据每个学者的文章信息为其打上兴趣标签。本文提出了一种基于网络表示学习的学者兴趣标签发现模型,本文在最大的人工标记Aminer数据集上进行实验,相比于目前效果最好的方法的准确率有2.7%的提升。本文的模型结合了概率统计模型和深度学习模型的优点,能有效的捕捉节点之间的全局关系和节点内部的语义信息。
其他文献
自由立体显示技术无需额外的辅助设备即可将左右眼图像精确投送到观看者的左右眼,使观看者能够观看到逼真的三维图像,相对于辅助式立体显示技术来说具有更大的研究价值和应用
天基物联网能充分发挥卫星全球覆盖、广域连通等优势,有效解决大规模,跨区域和复杂恶劣环境下大量物联网节点全球无缝接入问题,已成为当前国际上航空航天和网络通信领域的交
作为一种重要的软件测试技术,变异测试不仅可以用于构造完备的测试用例集以揭示软件缺陷,而且可以用来衡量测试用例集的揭错能力,评估测试用例集的有效性。然而,变异测试所产
难加工金属材料的加工问题,一定程度上制约着我国许多关键领域的突破和发展,比如航空制造业、军工产业及核电船舶制造等,其背后面临的痛点问题难以解决。而短电弧加工技术则
CPE(cross piercing and elongating)作为生产无缝钢管的机组之一,在生产小规格薄壁和中壁管时具有成本低、生产效率高、较好的内表面质量和较大的延伸系数等优点。由于对顶管
近年来随着工业电气自动化的蓬勃发展,变频器及PLC在工业生产中的应用越来越广泛。然而随着时间的流逝,变频器及PLC在服役十几年后出现严重老化现象故障问题频出,已不能满足
农民专业合作社是连接农户与市场的重要载体,在构建现代化农业产业体系、生产体系、经营体系,提高农业创新力、竞争力,促进农村产业融合等方面发挥着巨大作用。随着农民专业
对聚合物薄膜的制备和性能的研究具有重大的科学研究意义。根据聚合物材料本身所特有的物理化学性能,可制备出各种功能薄膜材料以解决一系列复杂的技术问题。聚苯胺(PANI)具
现实中,牵引机构用途广泛且种类多样,许多牵引机构都使用钢丝绳来牵引负载。钢丝绳是一种柔性的空间螺旋钢结构制品,具有柔软性、阻尼吸收和强度高的特点,是一种复杂的弹性部
目前,粉体材料通常以涂层的形式应用于航空航天、建筑节能以及国防技术等领域,如航天器的热防护涂层等。涂层的辐射特性参数,尤其是高温工况下的辐射特性参数对研究涂层与设