【摘 要】
:
实体关系抽取可以从互联网海量数据中自动抽取知识形成结构化的数据,减少人工整理数据和提取知识的工作量,具有重要意义。传统的实体关系抽取方法多数都依赖于自然语言处理工具,因此实体关系抽取的性能严重依赖于自然语言处理工具的水平。使用自然语言处理工具所带来的误差,还可能会干扰实体关系抽取过程,使得模型的抽取性能下降。研究了基于深度学习的实体关系抽取方法,研究过程中没有借助自然语言处理工具对文本进行处理,在
论文部分内容阅读
实体关系抽取可以从互联网海量数据中自动抽取知识形成结构化的数据,减少人工整理数据和提取知识的工作量,具有重要意义。传统的实体关系抽取方法多数都依赖于自然语言处理工具,因此实体关系抽取的性能严重依赖于自然语言处理工具的水平。使用自然语言处理工具所带来的误差,还可能会干扰实体关系抽取过程,使得模型的抽取性能下降。研究了基于深度学习的实体关系抽取方法,研究过程中没有借助自然语言处理工具对文本进行处理,在抽取关系之前使用了分布式的词向量来表示文本,把单词嵌入到低维空间以保留上下文之间的关联性。除了使用卷积神经网络和循环神经网络分别进行实体关系抽取研究外,还将两类神经网络组合在一起进行实体关系抽取研究。首先分别使用卷积神经网络和循环神经网络对实体关系抽取进行研究,研究了文本中的词向量特征和位置特征、局部特征、序列特征等,分析这些特征对实体关系抽取模型性能的不同影响。然后将卷积神经网络和循环神经网络组合在一起,分别使用了串联、并联的组合模型对实体关系抽取进行研究,在没有使用自然语言处理工具的情况下,组合模型获得了接近于传统机器学习使用了自然语言处理工具的抽取效果。最后采用了多模型联合抽取的方法,实验结果表明该抽取方法在实体关系抽取结果上取得了较传统机器学习方法更优的性能。
其他文献
生物地理学(Biogeography)是一门研究自然界种群迁移机制的科学,Dan Simon用生物地理学的方法和机制来解决工程优化问题,提出了生物地理学优化算法(BBO,Biogeography-Based Optimiz
近年来,中国女子竞技体育运动以发展快、项目多、实力强、潜力大的特点,优于男子的发展,出现了众所周知的体坛“阴盛阳衰”现象。通过对中国社会制度、国外竞技体育背景等几
本文从银行信贷质量角度出发,研究地方金融监管的金融风险防控有效性。研究发现,加强地方金融监管能降低银行的不良贷款率,有效提高银行信贷质量;地方金融监管对银行贷款质量
目的探讨拘禁球囊技术(JBT)在冠状动脉分叉病变介入治疗中的有效性.方法通过PubMed、EMbase、Cochrane Library、中国知网、万方等数据库收集使用JBT治疗冠状动脉分叉病变的相
目的探讨不同糖耐量人群血浆内脂素的变化及其与体重指数(BMI)、腰围、血糖、胰岛素抵抗指数、胰岛B细胞功能、血脂等的关系。方法2006年4月至2006年10月在南京医科大学第一
杭州市某草根组织C曾是当地颇有影响的一家农民工自组织团体,2010年该组织被纳入到体制之内,成为工会下属的志愿者服务站。这一转型为我们认识当前福利治理背景下社会救助服务
发展性评价是以促进学生发展为目标,并兼顾知识与能力,结合过程评价和终端评价的一个系动态的评价过程。在小学数学教学中,发展性评价要求民主、开放、灵活、多维的评价策略,
资本账户开放的利弊一直是学界争论的焦点问题,国际金融危机以后其蕴含的金融风险逐渐引起重视。考虑到金融系统之间的复杂关联性,本文利用TVP-FAVAR模型构建了涵盖7个市场维
2017年3月27日,欧盟部长理事会采纳关于玩具安全指令附件II的修订内容,为适应技术进步,玩具中重金属铅的迁移量将进一步降低。
目的对康复训练结合心理康复对脑卒中偏瘫患者上肢运动功能的影响进行临床分析。方法选取本院2018年1月~2019年6月收治的100例脑卒中偏瘫患者为研究对象,随机分配此100例分别