【摘 要】
:
自动文本摘要技术旨在从文本中提取重要信息来自动生成摘要,它能够对文本的信息进行有效压缩与提炼。这在信息急剧增长的互联网时代,可以有效地解决信息过载问题,从而极大地提高人们浏览和处理信息的效率。本文在对生成式摘要方法进行研究时发现,现有模型主要采用编码-解码的方式生成摘要,而这种方式缺少了对文本信息的选择过程,导致有大量与摘要无关的冗余信息对生成摘要造成干扰。因此,本文认为目前的主要挑战在于从原文本中有效地选择出重要信息,并忽略掉非关键信息。
针对上述挑战,本文基于选择性编码模型(Selectiv
论文部分内容阅读
自动文本摘要技术旨在从文本中提取重要信息来自动生成摘要,它能够对文本的信息进行有效压缩与提炼。这在信息急剧增长的互联网时代,可以有效地解决信息过载问题,从而极大地提高人们浏览和处理信息的效率。本文在对生成式摘要方法进行研究时发现,现有模型主要采用编码-解码的方式生成摘要,而这种方式缺少了对文本信息的选择过程,导致有大量与摘要无关的冗余信息对生成摘要造成干扰。因此,本文认为目前的主要挑战在于从原文本中有效地选择出重要信息,并忽略掉非关键信息。
针对上述挑战,本文基于选择性编码模型(Selective Encoding for Abstractive Sentence Summarization, SEASS)设计了一个关注主题的选择性编码模型(Topic-aware Selective Encoding Model,TSEM)。TSEM模型将文本的主题信息作为先验知识分别融入到编码器和选择门网络中,来提高模型对文本信息的理解及选择能力。此外,本文还提出了一个对照机制,该机制可以使模型在训练的过程中充分考虑到摘要与原文内容之间的差异,从而进一步提升模型对原文本信息的选择能力。
为了验证模型的有效性,本文在广泛应用于自动文本摘要技术的Gigaword公开数据集上进行了对比实验,并使用ROUGE评价方法对实验结果进行了评测。同吋,对模型生成的摘要进行了摘要重复率和主题相似度分析,并结合具体的案例定性分析了模型的效果。实验结果表明,融入了主题信息并且使用了对照机制的TSEM模型在ROUGE评分上能够取得更好的結果,相对于原SEASS模型在ROUGE-1,ROUGE-2和ROUGE-L评分上分别提升了1.39%、2.12%和1.22%,其生成的摘要可以包含更多原文的关键信息,和原文的主旨更相符。
其他文献
【摘要】出于经济建设和可持续发展的需要,人类对于水利工程中的地质勘察与岩土治理问的认知也有了实质性的改变。由于在水利工程中一切与水利的相关施工建设的首要条件和工作基础是地质勘察,因此地质勘察与岩土治理的工作就成了整个水利工程建设中至关重要且不可忽视的环节。本文从具体的实际施工情况出发,通过调查研究当下的水利工程建设中地质勘察与岩土治理存在的一系列问题,进一步针对地质勘察和岩土治理的问题提出相关的解
【摘要】水利水电工程施工质量不仅影响着工程的功能和效用,还关系到我国经济的发展、人们的生命财产安全,因此我们必须采取措施做好水利水电工程施工质量的控制与管理工作。水利水电工程施工质量受到自然环境、建造材料、水利水电工程特点、施工人员技能和素质、施工组织与管理等关键因素的制约,其工程质量控制还存在诸多问题,下面就针对这些问题提出具体措施,希望能够提升水利水电工程质量,确保工程安全、有效运行。 【关
【摘要】在电力系统中,35kV变电站占据着至关重要的位置,是其重要的组成部分,同时,二次设备在35kV变电站中也有着非常重要的位置,其发挥着重要的作用和功能,对整个的变电系统的相关性能是非常重要的,主要包括其安全性和稳定性,所以,重视二次设备的检修维护及管理是非常必要的。在该文中,提出了35kV变电站二次设备检修维护措施和手段,分析了二次设备检修维护的内容,并且阐述了对其的管理。 【关键词】35
【摘要】文章针对水电站建设中的引水隧洞施工工程,对其施工勘察的重点内容进行介绍,分析引水隧洞施工技术应用中的重点和要点,并对其中的竖井施工中的注意事项和要求进行研究,以供参考。 【关键词】水电站建设;引水隧洞;施工技术 1、引言 近年来由于环境恶化和资源紧缺问题的不断加快,我国也加快了对水电站的建设速度,水电站的建设数据量在不断增多且建设规模也在不断扩大,使得水力发电在目前电网中地位不断提高
【摘要】受益于经济迅速增长的影响,我国的水电站建设事业获得了发展。对于水电建设资源的供应链而言,涵盖了供应商与分包商、工程承包方、物流方等诸多组织,其中施工阶段的主要物资与机电设备供应链风险管理可谓重中之重。本文通过阐述水电站建设期主要工程物资与机电设备供应链管理中的风险,进而从施工现场的主要工程物资、机电设备两个方面,提出了供应链风险的管控对策。此研究以分析水电站建设期主要工程物资与机电设备供应
伴随着移动互联网应用的高速发展,移动群智感知作为一种新型的数据采集和处理范式应运而生。移动群智感知利用分布广泛的移动设备用户进行数据的采集和处理工作,在诸多领域发挥了重要作用。然而移动群智感知系统依赖于大量移动设备用户的参与,为了更好地吸引移动设备用户,隐私保护与激励机制是移动群智感知急需解决的问题。
目前已经有许多隐私保护和激励机制的研究成果问世,但是很难将某项隐私保护的成果与某项激励机制的成果直接结合,而不影响其效果。有许多研究工作将隐私保护与激励机制结合起来考虑,设计了许多能够对用户隐私提
超可靠低时延通信(Ultra-Reliable and Low Latency Communication, URLLC)被认为是工业自动化、智能交通及远程医疗等众多新兴领域的技术基础,也是本文重点讨论的内容。本文主要分析了移动场景下URLLC的几何拓扑结构和性能,并使用分集重传策略提高成功率。以下行链路为例,考虑如何满足URLLC的服务质量(Quality of Service,QoS)要求,其中端到端延迟主要包含传输延迟和排队延迟,可靠性指标主要包含传输错误率和排队时延违反率。极低延迟下信道编码的码长
【摘要】水利水电工程施工质量是保障水利水电工程有效性的根本因素,如果质量无法达到相关的标准要求,那么整个工程就没有了价值。管理水平的高低是决定工程质量是否合格的关键点,所以必须要对质量管理重视起来。基于此,文章首先就水利水电工程的特点以及影响施工质量的因素进行了分析,而后探讨了水利水电工程施工质量管理中存在的问题,最后提出了行之有效的解决措施,希望通过文章的分析,能够促进工程的质量管理工作,进而使
【摘要】文章以水利水电工程的水库溢洪道设计为研究对象,首先以某工程为例对其工程概况进行了分析,随后对选择溢洪道孔口尺寸进行了研究分析,最后针对泄槽水面线进行了研究分析以供参考。 【关键词】水利工程;水库;溢洪道设计 前言: 某水库位于赣江支流,其以供水、灌溉为主,发电、防洪为辅,水库大坝为土石坝,在右岸坝端设有开挖式溢洪道,该溢洪道由由进水渠、控制段、陡槽段及消能段组成,其中进水渠底部宽度2
【摘要】我国水利水电工程建设的质量要求随着科学技术水平的提升而提高,因此,对水利水电工程进行施工技术的创新和完善是必然的,对灌浆技术的运用是相当重要的施工方式,需要不断对关键技术进行研究,并不断完善,促进水利水电工程质量逐渐提升。 【关键词】水利水电工程;大坝施工;灌浆技术 前言: 随着我国经济的发展与进步,在水利水电工程施工的过程中,科学合理的应用灌浆技术能够有效的提高水库大坝的坝基稳定性