融合知识的词向量表示方法研究

来源 :沈阳航空航天大学 | 被引量 : 0次 | 上传用户:sl2260ygl2260
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词的向量表示是以深度学习方法为主的自然语言处理核心问题。词向量被广泛地应用于多种自然语言处理任务当中,是一种有效的提升下游任务表现的方法。目前主流的词向量学习模型是基于分布假说的分布式词表示学习模型,然而该方法存在着一些问题。根据齐夫定律,语料中总是存在着大量的低频词。因为低频词的语言现象不丰富,所以导致低频词词向量的语义表示质量较差,不能较好地表示其自身的语义。本文针对该问题,提出了一种融合知网相关概念场的低频词增强方法。该方法无需借助语料,使用知网相关概念场作为低频词的伪上下文,二次训练低频词的词向量。实验结果表明,该方法取得了较好的实验结果,与基线方法相比可以更好地提升低频词的语义表示质量。融合知识的方法是一种有效的提升深度学习系统性能的研究思路。一般的融合知识方法都只考虑到了知识库中的元素,而没有考虑到知识库网络的结构。针对该问题,本文提出了网络表示学习驱动的翻新约束词向量学习模型。该模型首先将知识库中的元素和网络结构编码成向量,然后基于翻新约束指导词向量的学习过程。实验结果表明,本文提出的模型取得了较好的实验结果,可以获得比两个强基线模型语义表示质量更高的词向量。最后,综合本文提出的两种方法,构建了词表示学习系统,并且还对系统的设计和实现细节做了较为详细的阐述。
其他文献
无线传感器网络(WSN)是一种资源受限的功能性网络,它通过向基站传输感知信息长期执行监控任务。网络节点传输、计算和存储能力十分有限,其能量一旦耗尽难以供给,所以如何高效节能地执行WSN的数据采集任务,同时均衡网络能耗并延长网络生命周期是WSN课题中一项重要的挑战。本文从优化网络性能的角度出发,结合压缩感知理论和移动代理技术,设计一种基于移动代理的WSN压缩数据采集方法,利用移动代理可以在网络节点间
磁张量探测是近年来兴起的一种高精度勘探手段,具有信息量大、分辨率高等优点。目前,磁梯度张量勘探的应用前景日益广阔,有关张量数据处理方法的研究受到人们广泛的关注。边界识别是磁场数据解释中不可缺少的任务。磁梯度张量数据,对于直接勾划异常体的边界、圈定地下异常体具有更高的精度。基于磁梯度张量数据进行张量分量组合形成了多种边界识别方法,现今已经广泛应用于磁异常的处理解释过程中。但在目前大多数情况下,还是主
随着全球化进程的加快和女性主义的传播,印度女性的两性平权意识被逐渐唤醒。电影作为一种跨文化传播媒介,它对传播意识形态而言承载着不可言说的重要作用,印度电影理所当然地成为表达女性平等诉求的有力武器。1913年印度第一部本土故事片《哈里什昌德拉国王》标志着印度电影的诞生,后来又经历了“新电影运动”和“新概念印度电影”两次洗礼,印度电影逐渐摆脱传统“马沙拉”的模式,并在全球化的浪潮趋势下成为印度文化的重
招商引资是地方政府(开发区)吸引利用外地区或国家资源通过本地环境政策的支持,实现本地经济社会快速可持续发展的重要手段,是实现落后地区跨越式发展战略的重要途径之一。随
随着公民权利意识的不断加强,基于过度维权产生的纠纷也不断增多。但理论界与司法实践对此类案件的处理并未达成共识,同案不同判的现象时有发生,明确过度维权行为与敲诈勒索
社会主义核心价值观大众化具有价值观的规范意义、舆情的导向意义、文化发展的推动意义,以及群众信念的坚定意义。然而,当前社会主义核心价值观大众化存在着针对性不足、融入性不够、整体性不强的问题。社会主义核心价值观大众化是一个复杂的系统工程,存在着诸多影响大众化进程和效果的因素。将社会主义核心价值观大众化的受众,即一定的社会群体,视为一个复杂的研究系统,用社会群体中社会主义核心价值观大众化的程度来衡量系统
水资源的使用与我们日常生产生活的方方面面都息息相关。近年来,我国的水质污染愈发严重,因此对污水治理技术的不断探索在社会各界都得到了强烈关注及高度重视。油类物质污染是水体污染中最普遍也是最严重的污染之一,其主要来源包括油船的意外事故、海底采油、油船压舱水及炼油厂等工业废水的排放。超疏水材料的研究与发展是油水分离技术的关键。本文中分别以铜网和不锈钢网为基材,通过化学刻蚀法等多种不同的制备方法,制备出了
传统的多线程机制性能较差,数据同步方式是基于线程锁来避免资源竞争,在并发的环境下,线程锁可以保护共享数据,使得计算机系统中有限的资源可以被安全有序的访问。目前,协议栈软件多个线程通信和同步的主流的方法就是使用各类线程锁来进行数据同步。但是,基于锁的同步往往伴随着严重的缺陷,具体表现在线程锁会带来高度的资源竞争,在抢占资源的时候具有排他性,某一时刻只有一个线程具有使用某临界区资源的权限,这种串行等待
随着国家间商事交往的不断深入,国际性的商事仲裁不单单经历了数量上的持续增长,由于其涉及事项范围的扩大,国际商事仲裁的实践对理论研究也提出了新的要求。在这之中,争议事项是否可以进行仲裁是一个重要论题,在当事人就其争议提交仲裁庭仲裁时,仲裁庭首先应确定该事项是否具有可仲裁性,另一方面,当法院收到申请执行仲裁裁决或执行仲裁协议时,也应该确定该事项是否具备可仲裁性。国际商事仲裁历经多年发展,可仲裁领域呈现
制造业作为国民经济的主体,在全球经济发展过程中一直是国家竞争优势的主要来源。党的十九大报告强调要加快速度发展先进的制造业,培育若干世界级别先进的制造业集群,当前我国在供给侧的结构性改革之中的重要载体便是制造业集群。受经济的全球化影响,生产要素在世界范围内有序流动,不同国家或地区也逐渐成为全球产业链上的某一环节的发生地,生产的全球化以及产业集聚化倾向明显。我国已经拥有一批特定制造或工艺技术上已经能够