【摘 要】
:
针对摘要模型中总结并解释长篇上下文信息存在的困难,提出一种基于细粒度可解释矩阵,先抽取再生成的摘要模型(fine-grained interpretable matrix,FGIM),提升长文本对显著度
【机 构】
:
北京理工大学计算机学院,中国移动通信研究院,北京市海量语言信息处理与云计算应用工程技术研究中心
【基金项目】
:
教育部–中国移动科研基金(MCM20170302)资助
论文部分内容阅读
针对摘要模型中总结并解释长篇上下文信息存在的困难,提出一种基于细粒度可解释矩阵,先抽取再生成的摘要模型(fine-grained interpretable matrix,FGIM),提升长文本对显著度、更新性和相关度的可解释抽取能力,引导系统自动生成摘要。该模型通过一个句对判别(pair-wise)抽取器对文章内容进行压缩,捕获文章中心度高的句子,将抽取后的文本与生成器相结合,实现摘要生成。在生成端通过可解释的掩码矩阵,控制生成摘要的内容属性,在编码器端分别使用多层Transformer和预训练语言模型
其他文献
针对当前生成式文本摘要模型在解码时对摘要整体语义信息利用不充分的问题,提出一种基于语义对齐的神经网络文本摘要方法。该方法以带注意力、Pointer机制和Coverage机制的Se
通过对煤岩标准中的基础标准、方法标准、产品标准的综合分析,系统地论述了从煤岩样品采取、制备、检测及宏观到微观的煤岩标准体系,探讨了煤岩标准应用中煤岩分析样品制备、
基于粗煤泥分选是选煤厂经营的重点及难点,对选煤厂粗煤泥分选的可行途径进行相应的分析研究。研究表明:螺旋分选机和干扰床是选煤厂分选粗煤泥的可行方法,螺旋分选机适用于粗煤
食用菌是一类具有高等子实体的大型真菌,俗称蘑菇或蕈。郭沫若在《中国史学家》中记述,我们的祖先在6000~7000年前的仰韶文化时期就采食蘑菇了。2000年前的《礼记》等著作中也有
网络攻击是最重要的变电站安全问题之一,为了更好地识别易受攻击的变电站,首先需要对侦察活动进行建模。在此基础上研究相应的网络攻击和防御策略。利用马尔可夫决策过程建立
学习型企业,就是通过组织成员不断学习有关知识来提高自身素质,把学习力转化为创造力进而转化为生产力的企业。构建学习型企业的核心就是通过学习,培养企业不断变革的能力,使
针对多轮会话中的Non-Sentential Utterances(NSUs)问题,结合当前在自然语言处理领域广泛使用的预训练语言模型,将Masked Language Model用于多轮会话NSUs的重写任务,提出Mas
<正> 鲜枣好吃难放,用冷库贮存,把好关键环节,不但能延长存放时间,而且能保持枣的鲜脆度。 一、采前防病 8月中旬,对树上枣果喷洒0.2%氯化钙加12.5%烯唑醇可湿性粉剂2000倍液,
国有禹州林场建于1957年,下设4个分场。20世纪80年代,国有林场实行企业化管理改革后,林场经济十分困难。面对困难,我们没有低头,没有气馁,而是集思广益,找到了一条“发挥资源
分析了煤的高位发热量的计算原理,对ISO1928—2009、ASTMD5865—10a、GB/T213--2008中高位发热量的计算、硝酸形成热等问题进行了探讨,总结了在实际应用中不同情况的处理方法。