【摘 要】
:
中华文明上下五千年历史,文化博大精深,三国时期作为漫长历史长河中一个群雄并起、最有魅力的时代,出现了一大批经典英雄人物,有其丰富的历史文化内涵,受到大众的喜爱,考虑到之前知识图谱工作在三国历史方面的空白,本研究构建了三国人物知识图谱,设计了12种本体,30种关系,有三元组11600条,并针对知识图谱的关键问题设计了模型。本文分析了现有知识抽取模型的模型架构和意图识别槽位填充模型存在的问题,在减弱噪
论文部分内容阅读
中华文明上下五千年历史,文化博大精深,三国时期作为漫长历史长河中一个群雄并起、最有魅力的时代,出现了一大批经典英雄人物,有其丰富的历史文化内涵,受到大众的喜爱,考虑到之前知识图谱工作在三国历史方面的空白,本研究构建了三国人物知识图谱,设计了12种本体,30种关系,有三元组11600条,并针对知识图谱的关键问题设计了模型。本文分析了现有知识抽取模型的模型架构和意图识别槽位填充模型存在的问题,在减弱噪声数据影响的同时充分利用数据集信息,设计效果更佳的方法。在此基础上,进一步应用在三国智能问答机器人的构建上,最终构建具有实用价值的多轮对话问答机器人,帮助人们更好地了解、梳理三国知识,同时能够为后续的中文历史文本研究提供一定的参考价值。本文研究了一种基于双粒度注意力和对抗训练的远程监督关系抽取方法,采用包内句子级注意力机制和组内包级别注意力机制将训练注意力逐渐集中到高质量的样本数据上,减少了远程监督标注带来的噪声数据的影响,并通过对抗训练来提高数据利用率。具体包括:数据预处理、句子编码、双粒度注意力的多示例学习、实例级对抗训练、模型迭代训练等步骤。在纽约时报数据集和自建的三国关系抽取数据集上通过模型效果的一系列对比实验证明了本方法的有效性。本文研究了一种基于双向交互注意力的意图识别和槽位填充联合方法,涉及口语理解领域,采用卷积和双向长短时记忆网络对用户提问进行句子表征,通过提出一种双向交互注意力机制,考虑两个任务之间的交叉影响,令槽位填充和意图识别可以加入相互的信息,其过程中使用了多头注意力,有效地实现了意图识别与槽位填充任务之间的信息补充。模型在SNIPS、ATIS数据集和自建的三国数据集上与现有5种技术相比有效地提升了意图识别、槽位填充各自任务的效果,具有一定的实用价值。最后,构建了可以令用户访问的基于知识图谱数据库的三国知识问答机器人,该问答机器人具有闲聊功能和意图继承、槽位继承模块,实现了简单的多轮对话。现将本文的核心贡献概括为以下四点:(1)针对远程监督关系抽取中的训练数据利用不充分的问题,本文采用包内句子级注意力机制和组间包级别注意力机制将训练注意力逐渐集中到高质量的样本数据上,减少远程监督标注的噪声数据的影响,通过提出对抗训练来提高数据利用率。与现有技术相比有效地降低了噪声句子和噪声包的影响,解决了训练不充分、数据利用率低的问题,增加了模型的鲁棒性,提升了关系抽取的效果。(2)针对意图识别和槽位填充中单方向交互问题,提出一种双向交互注意力机制,令槽位填充和意图识别可以参照相互的信息,过程中使用了多头注意力。与现有技术相比改进了之前模型隐式共享参数的方式,实现两任务共同训练;改进了之前模型显式训练仅仅使用意图识别来提高槽位预测的方式;改进了显式训练模型两个任务不同步的问题。(3)构建了三国语料,包含一个三国人物知识图谱和两个模型训练数据集。三国知识图谱数据集融合了百度百科、维基百科等关于三国人物、地点、事迹的一系列数据,包含12种本体、30种关系;实体6388个、三元组11600个。三国人物关系抽取数据集使用远程监督的方法生成,并在保障数据质量上充分考虑了头尾实体距离限制。开展意图识别和槽位填充实验所用的三国数据由手工编写并标注的数据和模板批量产生数据混合构成,设计中充分考虑了语言表达的丰富性和用户表达的口语化,数据集已经公开在github网站(https://github.com/Ruiqing Gao/sanguo)。(4)开放智能问答机器人应用,可以实现多轮对话。人机交互以微信公众号为基础,按照语义解析式的任务型问答技术路线(意图识别、槽位填充、语义槽模板设计)设计出三国知识问答机器人,提供微信公众号(公众号名称:Nexus7Rachael)服务公开访问。
其他文献
数学作为一门基础课,其本身具有抽象的特性,学习数学能有效地培养和增强学生的学习能力和思维能力,在学生学习和应用知识方面能起到很大的作用。要想加强学生对数学的理解,首先要注重让学生在快乐的课堂氛围中体验数学学习的乐趣,全面提高数学综合能力。初等教育是学生知识发展的基本阶段,注重提高教育质量可以为学生后续的学习奠定扎实的基础,从而提高学习效果。而要想使小学数学教学质量得到提高,教师就要从多个角度出发,
随着医学影像人工智能(Artificial Intelligence,AI)技术的发展,人工智能方法日益成为计算机辅助诊断(Computer-Aided Diagnosis,CAD)研究的主流方法。借助CAD系统,影像科医生可以快速地获得计算机的辅助诊断结果作为参考,有利于更准确地做出最终的诊断与决策。为了让临床医生可以更便捷地使用CAD系统,自动化的全流程CAD系统是未来的发展方向之一。医学影像
阶梯水价制度,是指在合理核定居民生活用水及各类企业营业用水基本用量的基础上,对定量以内的用水实行低价,超过定量的用水实行累进加价。对于我国城镇用水而言,阶梯水价制度包含居民生活用水阶梯水价制度、非居民用水超定额累进制加价制度。科学有效的阶梯水价梯度结构能够促进节水优先实施,但目前阶梯水价中水量和水价的梯度设置尚未充分发挥对节水的激励作用。本文的主要研究内容与所得结论如下:1、以我国288个实施三级
面向老年群体的日常照护是当下我国正在面临的重要民生问题。在老龄人群的日常生活中,跌倒是发生频率最高且对老人健康带来威胁最为严重的事件,如何实时发现、预防、干预跌倒事件,降低跌倒发生概率,减少其对老年群体生活质量的影响,是养老照护相关行业一直面临的行业难点。随着信息技术、数字智能技术的飞速发展,研究学者们开展了一系列面向跌倒问题的检测、建模、预测研究,以期为老年群体的跌倒问题提供新的解决方案。然而,
植被含水量是表征作物健康状态的重要指标,及时准确地获取大范围冬小麦生长期的冠层含水量,有利于获取小麦生长信息、开展干旱胁迫评估、指导精准灌溉,对建设高标准农田和保障粮食安全具有重要意义。传统实地测量方法耗时耗力,易破坏田间作物,且只能单点采样。近年来,中高分辨率遥感卫星Landsat-8和Sentinel-2以多光谱和高时效的优势,为快速获取大范围冬小麦冠层含水量提供了数据支撑。然而,受影像空间分
新中国成立初期,中共通过重构城市社会团体的方式,将社会团体转化为人民团体,使之成为高度集中统一的国家管理体制的一部分,以此实现国家政权向城市基层社会的渗透。而上海市工商业联合会作为联系工商业者的人民团体,是中共政治整合中极具代表性的城市社会团体,在众多社会团体中具有鲜明特点。本文试图从组织视角出发,探讨具有“双重代理”身份特征的上海市工商联在不同政治形势下履行的职能,挖掘其自组织建立初期到公私合营
党的十九大提出到本世纪中叶要达成全体人民共同富裕的基本目标,将促进全体人民共同富裕作为为人民谋幸福的着力点,这表明共同富裕是社会主义的本质要求,也是中国式现代化的主要特征。新时代为实现共同富裕创造了条件,经济快速发展带动人民生活提高,脱贫攻坚战全面胜利,这些都为实现更高层次的共同富裕打下了坚实的基础,但同时城乡发展差距大、公共服务资源不足等挑战仍然存在,因此推动共同富裕的实现就是解决好这些发展不平
管理会计源于企业管理,通过对经济活动的预算、决算、规划、控制、责任考核评价,最终实现经济效益最大化(即利润最大化)。随着财税改革的不断深化,全面实施预算绩效管理的推行,如何运用管理会计的理论、方式方法,解决行政事业单位投入产出不匹配的问题,实现财政资金“效益最大化”的目标,是需要我们认真思考及解决的问题。行政事业单位中应用管理会计,可帮助其正视社会快速发展与管理改革挑战,有效融入管理会计来提高内部
高等职业教育是全球科技加速进步背景下各国深化产业结构调整,促进高等教育发展的重要力量。第二次世界大战结束后,受第三次科技革命风暴、移民浪潮、经济结构调整等多方面的影响以及在联邦政府的积极干预下,澳大利亚逐渐形成了能力本位,面向行业需求的独具特色的国家培训体系,值得各国反思与借鉴。以《坎甘报告》的出台为开端,澳大利亚高等职业教育明确了“以人为本”的教育理念,初步构建了高等职业教育管理体制,创设了种类