基于超图的文本摘要与关键词协同抽取研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:paleont
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,网络信息呈爆炸式的增长,如何快速有效的获取网络信息已成为一个重要的研究问题。文本摘要和关键词抽取技术正是在这样的一个背景下发展起来的,随着信息检索和自然语言处理技术的发展,文本摘要和关键词抽取这两个技术已成为近年来的研究热点。文本摘要和关键词抽取是自然语言处理领域的两个重要研究课题,它们均以生成描述文本主旨内容的精简信息为目标。尽管这两个任务目标相似,但它们通常被作为两个独立的问题分别研究,而较少考虑其彼此间的自然关联性。尽管已有学者提出了基于图模型的协同抽取方法,该方法同时考虑了句子与句子、词与词、句子与词之间的各种关系,以迭代强化的方式同时生成文本摘要和关键词,但现有模型大多仅限于表达句子与词之间的各种二元关系,而忽视了不同文本单元间潜在的若干重要的高阶关系。鉴于此,本文提出了一种新的基于超图的协同抽取方法。该方法以句子作为超边,以词作为结点构建超图,在一个统一的超图模型下同时利用句子与词之间的高阶信息来生成摘要和关键词。在NLPCC2015面向微博的新闻文本摘要任务数据集上的实验结果验证了本文所提方法的可行性和有效性。基于我们提出的方法,实现了一个面向新闻的在线自动摘要与关键词协同抽取系统。该系统可以实时获取新浪新闻中心热门排行榜上的新闻,为每个新闻生成摘要并同时抽取出其中的关键词,以简要的形式展示给用户,用户通过浏览文章的标题、关键词以及摘要来迅速了解新闻的关键信息。
其他文献
快鸟卫星是美国Digital Globe公司所拥有的商用高分辨率光学卫星,其影像分辨率高达61厘米。这种高分辨率卫星数据已经被广泛应用于国土、规划、测绘、遥感等领域,在交通领域的应用也越来越深入。由于在快鸟卫星影像上能清楚地观测到车辆,因此利用它来辅助交通监控越来越得到人们的关注。为了能从快鸟图像上分类出车辆目标,本文使用了一种纹理分析结合神经网络的方法来对快鸟图像进行分类。首先对快鸟图像进行预处
P2P网络作为一种分布式的网络结构,改变了以往C/S(客户端/服务器)为主的网络结构,成为得到网络用户广泛认可一种结构。然而,P2P高效的文件分发机制在为用户带来便利的同时也
如今,人们把握数据的能力在不断提升。面对海量数据,人们更加关注的是隐藏在数据背后的重要信息,而非数据本身。数据挖掘满足了我们的需求,它是帮助我们发现数据中重要知识的
网格被视为继Internet技术和Web技术之后的第三代互联网技术,能够最大限度地实现网络资源共享和调度,因此网格技术在国内外迅速发展。   网格的目标就是能够实现计算、存储
随着无线网络的广泛应用与飞速发展,不满足Internet基本假设的受限网络不断涌现。与传统无线网络不同,这些网络中通常不存在稳定的端到端路径,传输延时一般较高。容迟/容断网
本文主要研究了基于空间变换核天文图像降晰算法及硬件实现,以达到南极天文站(AST3)对图像实时性和低功耗的要求。本文实现了一种基于传输触发体系结构(Transport Triggered
目前,P2P技术已经成为近年来互联网最热门的技术之一,它具有对等性高、健壮性好、负载均衡等优点,得到了广泛应用。但是,目前P2P的应用还存在一些问题,如P2P带宽滥用,P2P网络蠕虫传
进入21世纪以来,互联网的快速发展以及带宽的提升使得通过互联网获取各种对带宽要求较高的多媒体服务提供了可能。以往的单播方案,采取C/S模型,在特定的服务器和每位用户之间
本课题主要研究多媒体教学场景中的跟踪问题,以场景中授课教师为跟踪目标,要求实时录制教师授课情况。基于特定的应用场景,课题在单目标、单摄像头,且目标和摄像头都运动的情
随着信息化时代的不断推进,人们对信息化技术的依赖逐渐变大,游客的个性化需求增多,也更倾向于选择去信息化建设完善、能尽量满足他们个性化需求的景区。因此,为了增加景区的