面向查询的多模式自动摘要研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:win13790
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet的飞速发展极大方便了人们对信息的获取和使用,但同时也带来了信息过载的问题。在这些海量信息中快速、准确地找到所需要的信息变得越来越困难。面向查询的多文档自动文摘将查询返回的文档集合的内容提炼成包含与查询相关的主题、满足个性化需求的摘要,它能够显著提高信息获取和利用的效率。本文主要研究面向查询的多模式自动摘要问题。为了满足用户的个性化查询需求,设计了多种摘要模式。所做的主要工作包括以下几个方面:第一,将复杂网络的相关理论和方法成功引入到了自动文摘领域。提出了文档集合的复杂网络表示方法,将文档集合表示为以文本、段落为节点的双层网络结构;重新定义了模块度增量矩阵△Q,采用CNM算法思想对文本、段落进行自适应聚类以发现子主题。它们为后面的多模式摘要设计奠定了基础。第二,研究了文摘单元的提取策略。一方面,在采用基于关键词提取的文摘句打分方法后,通过衡量各个类的信息容量,从每个类中抽取不同数量的文摘代表句;另一方面,应用复杂网络中节点度的思想来分析每个段落的重要性,进而提取核心段落作为另一种文摘单元形式。第三,设计了多种摘要模式。为了满足不同用户的个性化查询需求,本文充分应用文档集合的网络拓扑结构,除传统的摘要模式外,又设计了概括摘要、偏重摘要、全局摘要和详细摘要这四种摘要模式。支持用户以主题为线索自主漫游,按照一定的逻辑顺序浏览信息。
其他文献
随着计算机网络的不断发展,互联网已经成为了人类社会主流的一个重要组成部分。人们希望互联网能够不断地提供应用所需的各种网络服务。特别是,以视频会议、视频点播、远程教
推荐系统作为一个高效的信息过滤工具,已广泛应用于电子商务和社交网络等诸多领域。然而,当前一些称为“水军”的恶意用户为获取不正当利益,往往通过伪造用户行为影响推荐结
Skyline查询作为数据挖掘的重要分支,广泛应用于多标准决策、可视化和用户参考查询等领域。近年来,在数据库和信息检索研究领域,有效计算Skyline的问题已经引起国内外研究者
随着信息技术和互联网的发展与普及,越来越多的人能够在网络上随时随地的发表自己的想法,分享自己的所见所闻;在线社交网络(比如Twitter、Facebook、新浪微博等)在信息的传播
XML因其具有自描述性,可扩展性以及开放性等优点已经成为网络上信息表达和数据交换的事实标准。随着XML数据的不断增长,尤其是大规模XML数据的出现(如XML数据库),对XML数据的
随着Internet技术的快速发展,Web数据库越来越受到人们的重视,Web按其所蕴含信息的“深度”可以分为Surface Web和Deep Web两部分。与Surface Web相比,Deep Web蕴藏了更加丰
计算机系统的飞速发展给软件提出了更高的要求,如何提高软件质量这一课题的研究越来越得到人们的重视,而软件的可靠性、正确性、安全性等性质是保证软件具有高质量的关键因素
随着计算机和网络技术的快速发展,互联网在人们的日常生活中发挥着越来越重要的作用。信息检索作为互联网应用的重要组成部分,是用户获取信息的主要方法。目前,信息检索一般
随着信息技术的发展和IP网络的应用普及,能够接入网络并且接受远程监控的网络用具逐渐走进人们的生活。网络用具涵盖范围非常广泛,包括数字化、智能化了的各种电器或增加了控制
随着信息化建设步伐的加快,如何有效化解安全风险,有效应对各种突发性安全事件已成为不容忽视的问题。当前,国家级的通信平台、政府职能部门、电信通讯运营商、跨地域大型企