基于类中心向量的论文作者归属机构自动识别方法研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:yesyouok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对大规模科技文献进行整理分析时,常常需要自动识别论文作者所归属的组织机构,此时需要将论文中的作者地址信息与对应的机构名称进行自动匹配。同一个机构的作者地址信息在不同的英文论文中可能出现多种不同的写法,这给匹配造成了困难。针对这一问题,设计出一种机器学习方法,此方法充分利用英文论文中作者地址的书写特点,在基于类中心向量的基础上将作者地址信息与机构名称进行自动匹配。与传统方法比较,该方法不需要手工编写烦琐的匹配规则,被应用于中国科学院作者地址信息数据集,实验结果证明了此方法的可行性。
其他文献
本文以某高速公路隧道出现缺陷病害进行检测修复加固为工程背景,介绍了公路隧道出现缺陷病害时,如何进行检测,修复方案设计及工程应用,供隧道养护人员参考借鉴。
北细辛为我国东北地区主产的药材。本文简要地介绍了野生北细辛生长的环境条件,并对它的根系在土壤中的分布、不同郁闭度下地上部分生长情况、更新芽分化形成与生境的关系作
多媒体会议子系统体系架构主要由多媒体会议应用服务器和媒体处理单元构成。针对多媒体会议应用服务器的软件架构和信令流程进行设计,展示了该子系统的体验效果。试验结果表
为了满足科研实验设备使用的需要,我厂设计制造了HCN激光干涉装置。该装置的关键零件是金属柱面光栅,在光栅制造方面我厂遇到了不少困难。开始曾试用插床、座标镗床等方法进
期刊
《体育与健康课程标准》的出台顺应了当今世界体育课程的发展趋势——体育课程目标向着增进健康以及多功能、多目标的方向发展;课程内容日趋综合化、多样化、弹性化、人文化;课
笔者所在公司是一家以生产制造通信光缆为主的中小型工业企业.虽然规模不大,却也五脏俱全.从员工的差旅、购货等日常报销到成本核算、登记总账、明细账、出报表,再至税务局报
进入春季后,天气逐渐回暖,各种畜牧养殖场(户)开始纷纷补栏,因此,春季成为动物防疫工作的关键时期。只有切实抓好动物春防工作,防止重大动物疫病的发生和流行,才能保障人民群众
针对低碳经济下内河班轮航线配船问题,在给定运输需求和航线的前提下,以船队经营成本最低、碳排放量最小和发船频率最高为优化目标,建立低碳内河班轮航线配船优化模型,提出一
在分析高校图书馆数字资源用户群体的需求和实施个性化信息检索服务关键技术的基础上,对高校图书馆整合数字资源,提供个性化信息检索服务方面进行了探讨。
磁共振心肌纵向弛豫时间定量成像(T1mapping)和细胞外容积(extracellular volume,ECV)的测量可在活体水平定量心肌的T1值和细胞外间隙的大小,能够无创性评估局限性和弥漫性心