基于树核函数的中文实体语义关系抽取方法的研究

被引量 : 0次 | 上传用户:muhututu1216
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体语义关系抽取是信息抽取中的重要部分,其目的是从文本中找出实体对之间的语义关系并对它们进行分类。现阶段在英文语料上的实体关系抽取研究已经开展的比较全面和深入,取得的F值达到75%以上,不过离实用化还有一段距离。与英文关系抽取研究相比,中文的研究起步相对较晚,现阶段的研究方法大多是把英文中的基于特征向量的方法移植到中文环境里面,取得的性能也比英文低。另一方面,基于核函数的方法由于能捕获关系实例的结构化信息,在英文关系抽取中取得了较好的性能,而在中文关系抽取中还需要深入的研究。本文研究了基于树核函数方法的中文实体语义关系抽取,研究内容主要包括:1.构建一个中文实体关系抽取原型系统,比较中英文语料资源的实体类型以及关系类型的不同点,解决中文语料的预处理工作中所遇到的问题。2.提出基于卷积树核函数的中文语义关系抽取方法,改进关系实例结构化信息的表达形式,比较和分析中英文语义关系抽取中各类实体关系之间的差异。3.研究实体语义信息在中文语义关系抽取中的作用,并将实体语义信息和句法结构化信息结合成中文实体语义关系树,它能有效捕获关系实例的结构化信息和实体的语义信息。实验结果表明,同英文语义关系抽取一样,基于树核函数的方法在中文语义关系抽取中也能取得合理的性能,并且实体语义信息的加入又明显提高了关系抽取的性能,最终的F值达到了64.2,为下一步的研究工作奠定了良好的基础。
其他文献
营林科学化是保持森林资源永续利用、补充森林资源、维护生态环境、保证林产品质量的基础,是提高造林成活率和保存率,维护林业社会经济效益、生态效益协调发展的重要保证。
注塑机温度控制主要包括对料筒温度、料口处温度、喷嘴温度、模具温度、油温进行控制。温度是注塑工艺的重要参数,温度控制不好将直接影响到制品的质量。本文基于多点检测技
<正>数字化、网络化和信息共享是当今信息科学技术发展的最显著特征。纸质档案数字化就是把以传统形式保存的文件,即以纸质为载体的档案文件形式转化为以磁盘、硬盘、磁带等
慢性支气管炎是由于感染或非感染因素引起气管、支气管粘膜及其周围组织的慢性非特异性炎症。其病理特点是支气管腺体增生、粘液分泌增多。根据发作时支气管痉挛的存在与否,
武汉,湖北省会,中南重镇,"东方芝加哥"。黄金水道长江和南北大动脉京广铁路线在这里交汇,久有"九省通衢"之称。长江中上游货物集散中心,商界早有"货到武汉活"之说。然而,就运
毕业论文的质量问题关系到本科人才的培养规格和目标。近几年,由于学生找工作而不能安心完成毕业论文问题、论文的低劣问题、抄袭问题不仅引起高校管理者的重视,而且也引起社会
根据第三方物流实际,从客户需求及第三方物流企业自身竞争力着手,提出针对第三方物流企业市场竞争力评价的指标体系及评价模型。建立包括时间(T)、成本(P)、质量(Q)、服务(S)
本文以魏晋时期诗经学为研究对象,以“整体性原则”与“原生态式的把握方式”为指导,通过对材料的挖掘与整理,希望能对魏晋时期的诗经学作出系统的梳理。全文分绪论、正文、
文章首先分析了大学生心理健康教育课程教学中存在的问题,其次提出了在大学生心理健康教育课程教学中应用团体心理辅导的具体策略,即利用团体心理辅导活动的趣味性,提高学生
那天在东兴,我穿过车流如织的街道,一阵奇妙的琴声穿越刺耳的车鸣声、闹市嘈杂的吆喝声,直往我心里钻,一下一下深深地拨动着我心底的那根弦。禁不住琴声的诱惑我循声寻去。走