结合图卷积神经网络的文献作者姓名消歧

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:lsgaoyan2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科学文献管理中,存在大量的科学技术文献需要被高效的识别、分类和保存.对于研究者来说,在研究该领域的相关知识时,通常会检索该领域的相关专家的文章,然而,姓名作为检索的常见搜索经常会出现歧义问题,这导致文献检索、统计和分析的质量下降.现有的方法在数据集上仍不能表现出良好的聚类效果,如何实现有效的消歧方法仍是一项挑战.本文提出基于图卷积神经网络的作者姓名消歧技术.首先使用BERT模型将文献作者、出版机构、摘要等多种属性信息嵌入到低维向量空间中,得到与作者相关的多种属性的嵌入向量,克服嵌入向量不够准确的缺陷;接下来以节点嵌入为基础,为每篇文献都构建文献局部图,使用图卷积神经网络对生成的文献局部图进行链路预测,有助于提高链路预测的准确性;最后,在图上使用简单的连通域搜索并动态剪枝进行聚类.基于实验表明,本文提出的方法有比较好的性能提升,能够提高作者姓名消歧的准确性.
其他文献
8月17日,拼多多启动第三届“农货节”,设置“百亿补贴”“限时秒杀”频道超额补贴全国优质农产区以及地理标志农产品,助力农产区增产增收,提高地理标志农产品的知名度,打造优质产地品牌,推动农业产业升级。《人民日报》7月13日发文称,农业农村部调度数据显示,今年夏粮再获丰收,预计单产提高3公斤,产量再创历史新高。