【摘 要】
:
网络终端数量的增加,提高了数字图书馆中文献存储的能力。利用作者姓名进行文献检索是数字图书馆中常见的检索方式之一。但是,姓名同名现象导致了检索系统不能对文献进行有效地组织分类,其具体表现为输入某一人名时,文献系统会返回和该人名相关的所有文献,但是这些文献中存在有与用户搜索目标作者不相关的冗余文献,需要用户进行自行筛选、剔除,使得信息检索的效率下降。因此,为解决因作者同名而引起的歧义问题,国内外诸多学
论文部分内容阅读
网络终端数量的增加,提高了数字图书馆中文献存储的能力。利用作者姓名进行文献检索是数字图书馆中常见的检索方式之一。但是,姓名同名现象导致了检索系统不能对文献进行有效地组织分类,其具体表现为输入某一人名时,文献系统会返回和该人名相关的所有文献,但是这些文献中存在有与用户搜索目标作者不相关的冗余文献,需要用户进行自行筛选、剔除,使得信息检索的效率下降。因此,为解决因作者同名而引起的歧义问题,国内外诸多学者开展了相关研究,旨在将所有的文献都正确地归属到相应的作者名下,并且有组织地进行呈现,以提高数字图书馆用户的体验感。诸多研究者为解决姓名歧义问题,已经提出过各种各样的解决方案,但是依旧存在一些问题需要进一步地解决,主要包括:(1)目前一些方法有效信息利用不充分,不能全面反映待消歧文献。(2)目前数据库中的一些文献会存在部分信息丢失问题,譬如缺少了发表的日期时间、作者的主页信息等,这使得基于该类特征的消歧方法准确率急速下降。(3)随着时间的推移,文献数据库需要不断引入大量的新文献,目前一些方法无法对其进行动态处理或者对新文献的处理效率和质量低下。为解决上述问题,本文从异构学术网络图出发,提出了作者姓名消歧方法,其中本文做的主要工作如下:(1)基于多图融合的作者姓名消歧方法,解决单一模型信息利用不充分等问题。一些研究方法过度侧重于使用邮件、地址等特征,但这并不具有普适性,因为并不是所有作者都会提供这些信息,而且另有一些研究对于现有信息利用不充分,即单一地使用某种信息。为了更好地利用现有信息,本文提出了多图融合的机制,旨在充分挖掘现有信息中的潜在特征。本文首先构建了一个异构学术网络,并利用所设计的多个元路径,将其转换为同构图。为了将多个同构图的结构信息以及节点文本信息融合,全面提取特征,本文构建了多个图注意力神经网络对各个同构图进行学习融合,以得到文献节点的最优嵌入,最终结合谱聚类算法得到消歧结果。实验结果表明所提出算法的消歧准确率比传统方法提升了3%以上。随后通过消融实验,证明了所提出元路径的有效性,在单独使用这些元路径时也能实现较好的消歧性能。(2)增量模式下的作者姓名消歧方法,把作者姓名消歧任务看做是关系图重构问题。增量模式指新文献进入文献数据库时,对新文献中的同名作者进行消歧的情况,该情形下的一个难点在于如何对新出现的同名个体进行有效识别。现有方法在面对于新进入文献节点时需要对图进行重构并重新进行训练,这导致效率低下,不能尽快地将新文献引入到数据库中。因此,本文提出使用文献比对的方式来解决增量模式下的姓名消歧问题,并通过挖掘多个特征构建相似度函数,提高节点合并准确率。合作网络是区分同名作者最为有效的特征,因此,首先重新构建了合作网络,并依据中心极限定理,将作者节点进行合并,初步实现人名的消歧。之后又设计了多个相似度函数,用于进一步实现节点合并操作。其中为了更好地挖掘摘要的潜在特征以及作者写作风格特征,本文利用了摘要的树形结构进行语义学习。最终,实验证明了所提出方法的有效性,在时间效率上优于传统方法。消融实验进一步地证明了本文提出的相似度函数的实用性。因此,本文针对作者姓名消歧问题的研究,对于解决文献数据库中现存的一些问题,如同名作者文献分配不够准确、新文献进入数据库时作者姓名歧义等问题,具有重要的理论研究意义和实际应用价值。
其他文献
在自然语言处理的研究领域中,文本自动生成作为一项重要的前沿技术而受到高度重视,实现文本自动生成也被视为人工智能走向成熟的标志之一。文本生成技术是一类宽泛的深度学习技术,其衍生出一系列的通用模型,当将文本生成技术运用到现实任务上时,往往要求在通用模型上进行特定任务设计,以此来匹配不同任务的需求。本文主要研究文本生成技术在短文本生成任务中的应用,并选择任务中的类别维度进行深入研究。本文研究旨在希望可以
自十八大召开以来,党中央大力查处腐败行为。近年来,频繁曝光的高管巨额腐败案件也使得社会各界对于企业高管腐败的问题越来越关注。企业高管的腐败行为不仅能揭示出企业的内部治理问题,还会影响到整个社会的公平与稳定,如果不加以制止将会给国家、社会带来不可估量的严重后果。因此,为了提高制定“反腐措施”的效率及其实施效果,必须丰富有关高管腐败影响因素方面的研究,真正做到对企业高管腐败行为“对症下药”。我国作为一
近年来,制造业在推动经济快速发展的同时,也造成了严重的资源短缺和环境污染等问题。在此背景下,再制造作为一种节能环保、可持续的制造范式,成为政府及制造企业关注的焦点。再制造是指将废旧零部件或工程机械等废旧产品进行专业化修复或升级改造,使其恢复到新状态的生产过程。在再制造中,生产调度是组织生产活动的关键环节。科学的再制造生产调度能够有效地提高再制造产业的完工效率,促进社会经济的可持续发展。然而,由于再
随着互联网技术和电子商务平台的快速发展,越来越多的消费者选择在网络平台上完成交易。然而,不同于实体购物,在网络购物中,消费者难以直观地了解产品或服务,这种不确定性增加了消费者购买决策的不确定性。因而,消费者在做出购买决策前,会寻找有关产品和商家的在线信息,如在线评论和管理者回复信息。在酒店旅游评论中,在线评论和回复信息是潜在消费者获取有关酒店信息和消费体验的主要方式,也是其做出购买决策的重要依据。
证券发行管制是企业进入资本市场的一大门槛,因此制定合理的发行管制规则对于资本市场极其重要。早期由于我国资本市场制度不太完善,投资者整体素质不高,我国一直实行严格的证券发行管制政策,也就是行政机构代替市场来对证券价值进行判断,这在一定程度上对稳定资本市场产生了显著的成果。然而随着资本市场的不断发展,市场的价值判断能力不断提升,严格的证券发行管制能够带来的收益逐渐降低,而严格管制的弊端却并未减少,甚至
稳定的电力供给作为国民经济的重要命脉,对于维系国计民生具有十分重要的意义。准确预测短期电力负荷需求量,不仅能够保证电力系统的安全稳定运行,还有利于优化能源系统的资源配置,缓解能源压力。随着人工智能技术的不断发展,很多国内外学者提出了多种电力负荷预测模型以提升短期电力负荷预测的精度。然而,由于电力负荷数据具有泛化性弱且时序相关性强的特点,传统的人工智能算法无法获得准确可靠的电力负荷预测结果。针对以上
私募股权投资(Private Equity,简称PE),作为资本市场上的一股新兴力量,通过参与被投资公司的运营和管理而具有优化公司治理的效果,在实务界和学术界受到了广泛的关注。PE退出渠道主要是通过IPO上市来出售所持股权,从而获取巨额的资本增值收入。近年来,在一系列利好政策之下,例如注册制和科创板的推进等,PE的退出渠道得到进一步拓宽,这给PE行业带来了前所未有的发展机遇。退出在PE投资公司过程
化学思维是学生在化学学习中形成的一种具有化学学科特色的思维方式,通过化学思维培养,让学生可以更好理解物质世界。利用中国知网数据库对国内有关化学思维研究的文献进行统计分析;将有关数据导入到CiteSpace软件中进行可视化分析,并探寻研究热点及趋势。发现化学思维研究在中学化学教学中的应用是当前的热点及趋势,化学思维在深度学习和实际生产生活中所起的作用是当前化学思维研究中的前沿问题。
中国医药行业经济发展持续增长,在国民经济中的地位也在不断提升。同时,自2019年12月至今,因为新型冠状病毒肺炎疫情的爆发,行业恢复生产延迟、交通和运输无法恢复正常、医院非疫情相关药品下降等原因给生物医药行业带来了很大的不利影响。但是在长期看来,在我国人民生活的水平不断提升、群众的健康保护意识逐渐增强等因素的驱动下,国内生物医药行业发展趋势依然向好,生物医药企业仍具有较大成长空间。科创板设立后,越
随着在线旅游业发展,越来越多的消费者通过网络预订旅游服务和产品。在预订酒店时,潜在消费者会通过阅读旅游电商平台上的酒店在线评论来最大限度地减少购买决策的不确定性和风险。然而,过多的在线评论可能造成信息过载。因此,为了帮助潜在消费者找到有价值的信息,许多旅游电商平台都引入了一种反馈机制,即消费者可以对评论是否有用进行投票。从这种意义上说,评论有用性成为了潜在消费者关注评论的关键驱动力,且在一定程度上