实体链接中的关键问题研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:zhjjchj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
省略恢复是自然语言处理领域的一项关键任务,该任务针对存在省略现象的语句进行内容填充,从而使得语句的句式结构和内容完整,语义信息连贯。对话是自然语言中一种特殊的表达形式,相较于其他自然语言形式,人们在对话中的表述更加的随意和简练,难以被机器理解。而面向对话领域的省略恢复能够补充缺失的语义信息,促进了对话主题推进的整体把握,为问答系统、对话系统等其他下游自然语言应用提供极为重要的基础支撑。近年来,互联网的高速发展产生了海量的数据,基于这些数据之上的自动问答、人机对话等自然语言处理的应用成为热门的研究方向。但对于对话而言,有标语料极少,可借鉴的相关工作较少,因此面向对话领域的省略恢复研究存在许多未知的挑战。针对这一问题,本文开展了一系列研究工作,具体包括以下几个方面:(1)针对单轮对话的省略恢复问题,提出了一种端到端的序列到序列的神经网络模型。该模型双向上对序列进行编码,使用注意力机制保持语义“软对齐”,采用生成式解码单元得到补全后的序列。实验结果证明该方法在单轮对话的省略恢复任务中能够取得较好的效果,应对复杂的省略类型具有很好的鲁棒性。(2)针对序列到序列模型中存在的系列问题进行了改进,提出了一种细粒度的语义表征方式和一种融入序列约束信息的解码算法。改进模型首先在词嵌入层使用了一种结合句内词语字符信息的细粒度的词语表征方式;其次相比双向编码,增加了句内词语自注意力信息,提高了编码层的特征抽取能力。最后针对传统生成式解码算法存在的曝光误差和语义偏离的问题给出了一种带序列约束信息的解码算法。实验结果证明上述三方面的改进能有效提升单轮对话中省略恢复的性能。(3)针对多轮对话的省略恢复问题,提出了一种动态拷贝和掩码机制相结合的端到端神经网络模型。该模型使用门控机制自适应地融合拷贝模式和生成模式词语的概率分布,使用两种序列的边界信息来提高解码层省略恢复的准确度。实验结果证明了该模型的有效性。
其他文献
党在十九大报告中明确提出乡村振兴战略,乡村振兴战略是近几年来我国农村发展的重要战略。中国农村想要实现乡村振兴,必定离不开农村的人才。而农村人才的培养需要通过农民培
随着现今科技的发展以及人们环保意识的加强,对天然可再生纤维材料的需求日益显著。其中,二醋酸纤维素纤维作为一种吸附能力强、尺寸稳定性好,且生物可降解的环保型纤维材料,
随着铁路数字化、信息化、智能化建设的向前推进,无线通信业务需求不断拓展,并呈现出多媒体化、宽带化的发展趋势。然而,无论是现有的GSM-R还是即将布建的下一代铁路移动通信系统LTE-R,都面临无线电频谱资源短缺的难题,这将大大限制系统的承载能力,使得铁路无线通信需求无法得到充分满足。市场驱动的认知无线电频谱共享模式为化解频谱短缺难题提供了一个可行思路:铁路无线通信网络租借使用其他无线电网络(系统)暂
进入21世纪,信息技术在各行各业都得到了深入广泛的应用和前所未有的重视,企业的信息化水平在一定程度上直接决定了企业的内部运作效率,帮助企业提高核心竞争力,是企业在日渐
自2007年7月1日《中华人民共和国农民专业合作社法》(下文简称《合作社法》)实施以来,该法律确定了农民合作社的合法性。截止2019年7月1日,安溪在工商登记在册的农民合作社共
高等教育结构与产业结构之间存在互动关系,二者之间的协调度影响高等教育经济功能和社会作用的发挥。目前,河北省正处于“十三五”规划的关键时期,坚持推进转型发展,加快产业
近年来,随着生活水平的提高和大众对健康的重视逐渐加强,人们对健康信息的需求也呈现出旺盛增长的态势。各类医疗健康网站与平台是人们获取健康信息的重要渠道,据《第39次中
随着集成电路技术和应用的发展,能效优化成了集成电路设计所要解决的重要挑战。动态电压频率调整技术(Dynamic Voltage/Frequency Scaling,DVFS)是实现高性能与低功耗,提高系
第一部分3,4-HOPO的合成与表征目的:自主合成一种新型双功能螯合剂——3,4-HOPO,检测与各金属离子的络合常数并探究与DTPA相比的螯合能力。·方法:以麦芽酚为基础,通过一系列
随着时代的发展和科技的进步,以及大型复杂系统的建立,可靠性和安全性问题越来越受到人们的重视,其研究对于设备的优化和性能改进具有重要的现实意义。传统故障树分析方法对