【摘 要】
:
异构信息网络在许多领域中有着广泛的应用。随着社会的不断发展,新的事实不断出现,利用互联网中新的事实扩充已有的异构信息网络成为学者们重要的研究任务之一。然而,隐含在新事实中的实体往往具有歧义性,如何从海量的网络新事实中发现实体并消歧,从而有效地扩充异构信息网络变得十分重要且具有巨大挑战。因此,本文研究通过实体链接将网络文本中的实体指称项与其在异构信息网络中所指代的真实实体相链接,从而实现对异构信息网
论文部分内容阅读
异构信息网络在许多领域中有着广泛的应用。随着社会的不断发展,新的事实不断出现,利用互联网中新的事实扩充已有的异构信息网络成为学者们重要的研究任务之一。然而,隐含在新事实中的实体往往具有歧义性,如何从海量的网络新事实中发现实体并消歧,从而有效地扩充异构信息网络变得十分重要且具有巨大挑战。因此,本文研究通过实体链接将网络文本中的实体指称项与其在异构信息网络中所指代的真实实体相链接,从而实现对异构信息网络的知识扩充,主要研究工作包括:(1)针对不同来源不同文本的结构不一致导致算法难以自动适应文本的问题,提出一个无监督的面向半结构文本的信息抽取和实体链接框架UIEEL。该框架引入HAO(Human Intelligence,Artificial Intelligence,and Organizational Intelligence)模型的思想,通过组织智能(organizational intelligence,OI)和人类智能(human intelligence,HI)提供的智能支撑,为框架注入领域知识和专家经验。在框架的信息抽取模块,设计了一种规则自动学习方法(artificial intelligence,AI),降低了规则模板的制定成本和代价,使算法能够自适应不同结构的文本。在框架的实体链接模块,采用基于相似度的无监督实体链接算法(artificial intelligence,AI)将信息抽取模块中得到的实体链接至知识库中,实现对知识库的扩充。实验结果表明了本文所提框架内算法的有效性和泛化能力。(2)针对已有集体实体链接方法的时间复杂度高的问题,提出一个基于进化算法的集体实体链接框架ELEA。首先,分析并总结集体实体链接方法计算复杂度较高的原因。其次,针对该问题,将多目标进化算法引入实体链接任务中,提出一种基于多目标进化算法的集体实体链接框架。该框架对集体实体链接算法进行概率模型建模,将求解问题转化为多目标优化问题,采用多目标进化算法搜索最优解。实验结果表明:所提框架在保证精度的同时有效地降低了集体实体链接方法的运行时间。(3)针对已有集体实体链接方法多基于维基百科,导致难以适应未映射到维基百科的异构信息网络问题,提出一种从粗粒度到细粒度集体实体链接算法CFEL。在粗粒度模型中,在人类的大范围认知机制的思想下,删除与文本中实体指称项的类型不一致的候选实体,达到降低算法运行时间的目的。在细粒度模型中,提出一种结合文本的语义信息和异构信息网络中的路径信息的概率方法,充分利用已有信息对实体指称项及其候选实体之间的链接概率进行建模。最后,实验结果表明:与同类算法相比,所提算法所采用的从粗粒度到细粒度的思想可以有效地提高实体链接的精度。
其他文献
<正>近年来,在湖北省委统战部、省民宗委的坚强领导下,湖北省道教协会高度重视道教人才培养工作,按照"政治上靠得住、宗教上有造诣、品德上能服众、关键时起作用"的标准,积极贯彻落实国家宗教局《关于指导和支持道教界加强人才队伍建设的若干意见》,做了一些探索,取得了一些成效和经验。主要做法是:
硫(Sulfur)是构成生命体必不可少的重要元素,以多种化合物形式参与到生物体的代谢过程中。硫化物(HS-和H2S),尤其是H2S,被证实是继一氧化氮(NO)和一氧化碳(CO)之后的第三种内源性气体信号分子,在机体内发挥着重要的生理功能,比如舒张血管、抗肿瘤、炎症调节和抗氧化等。酶催化产生内源性H2S已广为人知,其可以转化为活性硫烷硫(Reactive sulfane sulfur,RSS),二者
冷战结束至今的三十年间,东亚地区的制度建设呈现出复杂的国家间竞合图景。一方面,伴随着相互依赖的日益加深,国家间的制度合作取得了迅速进展。另一方面,国家间在这一进程中的制度竞争和相互制衡也尤为显著。传统上,地区制度建设被认为是制度实用主义和功能主义的产物。然而,东亚地区制度建设的目标和导向、地区国家参与制度建设的动机和策略远非地区制度合作带来的绝对收益所能解释和概括。相反,国家间围绕着地区制度设计的
随着我国中西部高速铁路、高速公路等基础设施不断发展建设,喷射混凝土广泛应用于隧道工程施工过程中。液体速凝剂作为喷射混凝土中的核心外加剂,需求量越来越大。高碱性液体速凝剂由于其腐蚀性极强,容易对水泥后期强度造成损失而逐渐被淘汰。因此相关从业人员将研发的重点放在无(低)碱液体速凝剂上,但依旧面临着碱含量、氟含量偏高,稳定性差等众多痛难点。因此研发出一种高性能无碱液体速凝剂,主要研究内容如下:(1)先通
随着四旋翼无人机自主飞行技术的快速迭更,四旋翼无人机逐渐以体积小、结构轻巧、飞行机动性能大、续航持久等技术优点,广泛应用于城市景点拍摄和宣传、丛林、高山勘探等多复杂障碍物的环境下执行任务。提高四旋翼无人机在复杂障碍物环境中的避障飞行性能,解决四旋翼无人机在躲避障碍物时产生路径曲折、探测滞后、障碍物过大造成死循环问题成为业界研究热点。针对上述技术难题,本文以某型四旋翼为研究对象,通过开展基于改进型向
安全问题伴随着经济社会的发展并没有消失。时而发生的安全问题不断唤起社会公众对于安全问题的关注,高危行业的安全生产关系到人民生命财产安全的重要问题,党和国家一直对此类问题极度重视。在先前的安全管理中,对于企业经营者和管理者而言,出于“少做少错、不做不错”的原则,组织管理者往往都会极力地避免风险,大都拒绝在安全管理领域的创新。然而,频发的安全事故无一不在彰显以往安全管理的乏力。在过去的安全管理模式中,
浅水波方程的研究是非线性科学和偏微分方程领域的重要课题.本文主要研究了三类高阶非线性浅水波方程,就模型导出,初值问题的适定性,解的性质等方面展开了系统的研究,其中包括具有非零旋度的Camassa-Holm型浅水波方程,具有Coriolis效应的高阶大振幅浅水波方程以及高阶μ-Camassa-Holm方程.本文的研究工作如下:第二章研究了具有非零旋度的高阶Camassa-Holm(CH)型浅水波方程
卡通因其简单而生动的特殊艺术表现形式深受大众喜爱。从全球范围看,卡通动画产业已成为一个不断增长的庞大新兴产业。然而,卡通动画的制作是一个非常繁琐的过程,一部卡通动画往往包含成千上万的中间帧,其绘制和上色耗时又耗力。此外,早期的卡通动画存在划痕、污损、色彩差、分辨率低、压缩噪声等问题,无法满足当前用户的视觉体验要求。近年来计算机视觉、图像处理领域快速发展,尤其是随着深度学习的爆发,自然图像的生成、增