【摘 要】
:
概念图谱是具有层次结构的等级概念图,表征概念之间的上下位关系,通常通过语义关系的挖掘和分类层次的推理构建而成。在大数据环境下,概念图谱对网络数据的分析推理具有重要意义,且在个性化推荐、问答系统和Web检索等应用中发挥着重要的作用。构建概念图谱的首要问题是从数据中提取实体特征及其之间的关系,其次是通过无监督学习方法或者监督学习方法进行概念图谱的构建或扩展。现有的面向文本语料数据的概念图谱构建方法大多
论文部分内容阅读
概念图谱是具有层次结构的等级概念图,表征概念之间的上下位关系,通常通过语义关系的挖掘和分类层次的推理构建而成。在大数据环境下,概念图谱对网络数据的分析推理具有重要意义,且在个性化推荐、问答系统和Web检索等应用中发挥着重要的作用。构建概念图谱的首要问题是从数据中提取实体特征及其之间的关系,其次是通过无监督学习方法或者监督学习方法进行概念图谱的构建或扩展。现有的面向文本语料数据的概念图谱构建方法大多采用两种方式,基于模式的多任务方法和基于聚类的方法。然而,基于模式的方法,定义的模式单一,忽略了较远词语之间的语义关系,构建的概念图谱漏检率高且覆盖面较低;基于聚类的方法,通常是基于语义相似性进行分类,其前提是语料库是由数量规模大,类别多样且均衡的数据组成,聚类的方法在大规模数据上计算复杂度较大,且依赖较强的假设性。本文针对上述问题,提出了基于图神经网络的概念语义表示方法和基于联合相似度的领域概念图谱构建方法,主要的研究工作如下所示:(1)针对基于模式的方法构建的概念图谱大多忽略了跨文本且距离远的语义关系的问题,本文提出了一种基于图神经网络的概念语义表示方法(GNNTaxo)来捕获概念的语义特征。具体来说,GNNTaxo利用点互信息(Point-wise Mutual Information,PMI)和节点连接,对语料库中的文本数据进行建模,构建了一个既包含概念全局相似节点语义特征又涵盖概念局部结构特征的图数据,并通过文本分类任务完成概念语义表示的提取。GNNTaxo利用文本分类任务在两个真实数据集上的准确率都有所提升,从而证明了提出的基于图神经网络的概念语义表示方法可以捕获较好的语义特征。(2)针对基于聚类的方法使用简单的相似语义进行分类,忽略概念共现相似性的问题,本文提出了一种基于联合相似度的领域概念图谱构建的方法。具体来说,该方法利用概念语义表示的联合相似度提取词对关系,运用概念熵推断上位词,并提出两个规则进行节点融合,构建覆盖面较广的领域概念图谱。在两个数据集上通过两种不同的评估方法进行评估,本文提出的方法较其他基准实验都有较好的表现,从而验证了提出的基于联合相似度的领域概念图谱构建方法的有效性。
其他文献
微信数据取证的前置条件是解密微信数据文件和恢复删除的微信数据,鉴于一个微信用户通常还可能使用手机、平板及微机等不同平台登录微信,因此在数据取证过程中还有必要将不同平台下的数据进行整合处理。本文从手机、平板、微机常用操作系统的角度,进行多平台微信数据恢复与分析技术研究。以下是论文主要的工作和贡献:1、针对现有解密方法仅适用于Android平台微信主库以及Windows平台数据库文件的问题,在动静态逆
本文主要讨论了曲边区域上的三类偏微分方程的等参有限元方法.对于具有Navier边界条件的四阶椭圆问题,利用等参混合元方法,在数值积分的帮助下证明了离散问题解的存在唯一性,并给出了Ωh上的最优H1模误差估计.在不考虑Locking现象的情况下,给出了求解平面弹性问题的等参有限元方法,并证明了离散解存在唯一.同样给出了Ωh上的最优H1模误差估计,与使用凸多边形区域逼近弯曲区域相比,此方法的精度更高.对
通信中间件作为一种基础支撑软件,主要用于IP网络中,用以解决网络内部不同系统之间的应用交互问题。随着数据处理业务场景的多元化,由特定处理器构成的专用嵌入式计算平台正成为系统部署的主流方案之一,异构的系统能够充分发挥各处理器的特性,高效地解决实际业务问题,但是高度的异质性,也使得系统的软硬件复杂度上升,对分布式应用的快速集成提出了挑战,因此需要设计一种适用于嵌入式计算平台的通信中间件。本文从实际工程
随着物联网和人工智能技术的快速发展,人体行为感知在安全监控、智能家居、人机交互等领域应用越来越多,其相关技术也成为研究热点之一。相比于计算机视觉、专用传感器等传统技术,基于Wi-Fi信号的行为感知技术具有非接触式、成本较低及隐私保护更好等优势,近年来受到研究者的广泛关注。然而,在实际场景中,由于环境的复杂性及无线信号的高动态性,往往会导致基于Wi-Fi信号的行为感知模型检测精度下降。因此,如何有效
镁合金由于其具有可降解性、良好的生物相容性和适配的力学性能,作为可降解冠脉支架制备材料之一在血管支架领域具有广阔的应用前景。但由于它们降解速度快,导致支撑性能不足,无法满足临床对冠脉支架的力学性能要求,因此研究镁合金冠脉支架的降解性能具有十分主要的意义。近年来,计算机模拟技术被广泛应用于支架的设计和性能分析中,有限元分析在支架优化设计和性能分析中得到了广泛的应用。因此,使用有限元的方法研究并改进镁
本论文主要研究了以下两个问题.在第一部分中,从Drude模型,流体力学模型和薛定谔方程推导出了一种在超材料中具有非局部效应的麦克斯韦-薛定谔耦合方程组.我们假定自由电子和束缚电子分隔开,这两者分别起到不同的作用.通过基于流体动力学模型添加两个新的偏微分方程,将显示出非局部效应的影响.磁化控制方程将通过时谐技术得到证明.在磁高斯定律和时间规范场条件下,电场和向量势函数之间的连接方程可以建立.通过向量
形状记忆聚合物(SMPs)作为常见的智能材料可以感知外界刺激并作出响应,在起始形状和临时形状间进行切换。根据形状记忆过程是否可逆,可以分为单向SMPs(1W-SMPs)和双向SMPs(2W-SMPs),2W-SMPs在形状记忆循环中仅需要一次赋形后就可实现形状的可逆变换,在传感器、致动器、人工肌肉、智能织物、4D打印、表面微结构控制等领域有着极大的应用潜力。目前,2W-SMPs的驱动方式主要以热响
形状记忆聚合物(SMP)是在外部刺激(例如光,热,磁和电)的作用下,从编程的临时形状恢复到其初始形状的一类材料。作为一类刺激响应性聚合物,SMP可以感知周围的环境并产生直接的响应。形状记忆行为已在各种聚合物中被发现,包括无定形聚合物、半结晶聚合物和液晶弹性体等。SMP形状记忆行为是通过设计具有两个或多个阶段的材料来实现的,其中一个阶段负责固定原始形状,而另一个阶段则可以对所需的临时形状进行建模。热
溶液加工型有机电致发光二极管(OLED)具有亮度高、能耗低、响应快、成本低、可大面积生产等优点,在固态照明和平板显示方面具有极大的发展前景,代表了未来显示技术行业的发展方向。热活化延迟荧光(Thermally Activated Delayed Fluorescence,TADF)材料理论上可以实现100%的内量子效率,不需要贵金属掺杂,被认为是“第三代有机发光材料”,近年来受到了人们的广泛关注。