基于Web的新闻事件发现与极性分析

来源 :北京大学 | 被引量 : 0次 | 上传用户:w0wchenhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的不断发展,使得网络媒介已经成为了人们生活中重要的信息来源,尤其是新闻门户网站也为人们获得新闻信息提供了新的方式。据CNNIC的调查,网络媒体的使用率已经达到了78.5%,能够利用网络的快捷方式来获得新闻信息对于用户来说无疑具有十分重要的意义,但是数量繁多的新闻站点,以及网站内部的封闭性使得用户在获取新闻事件的信息上带来了极大地困难。用户希望能够从新闻页面的角度转换到新闻事件的角度来了解新闻报道,因此,基于事件的新闻信息整合与分析能为用户带来更多方便。   目前,大量的新闻站点为了能吸引更多的浏览量,往往对同一事件有大量的报道,同时基本不会利用链接指向其他站点的页面,这就使得用户想要全面、快捷的了解相关事件变得极为困难,因此能够从事件的角度对多站点的新闻进行整合就成为了一个很重要的问题。本文提出的Web新闻事件就是对新闻页面进行基于事件的整合,分析的结果。我们希望能够从一个粗粒度来认识新闻事件,考虑了事件的延续与变化性,采用了两步的聚合方式,来对新闻页面进行事件的整合。为了能够更全面的获得相关信息,我们提出了RIR-Crawler的算法来获得事件的相关信息,并基于实体提取的技术按照阶段对事件进行了要素提取,最终为事件生成了整体的描述。在获得事件之后,本文还对事件进行了极性分析。Web新闻事件分析系统在实际Web环境中的应用证实,我们提出的方案能够有效地获得Web新闻事件,具有较高的效率。我们的系统能够实时的获得最新的Web新闻事件,对于事件进行了有效地整合和分析,同时构建了用户交互界面,能够方便用户使用。
其他文献
为满足EAST实验中实验信息交互对象的多样性和实验人员远程交流的需求,提出了基于可扩展消息处理现场协议XMPP协议的即时通信系统方案。本文在对该协议进行了深入研究的基础
学位
回归测试是软件开发和维护期间保证软件新增加的功能或组件的质量,并保证原有的功能不受软件变更的影响的重要过程,它需要消耗大量的资源。重用已有的测试用例不仅能够减少生成
人工免疫算法的发展方兴未艾,在众多领域得到了广泛的研究应用,因此深入开展这方面的研究是十分必要的。本文首先研究了生物免疫系统以及人工免疫系统的基本原理,为进行免疫
随着Internet的飞速发展,Web上的信息量越来越大,通用搜索引擎在信息采集、存储等方面都将面临更加严峻的挑战。此外,通用搜索引擎面向Web上所有的检索用户检索不同类别的各种信
学位
入侵检测技术通过收集计算机或网络中若干关键点的信息,来监视计算机或网络系统的运行状态,以发现各种攻击企图、攻击行为或者攻击结果。入侵检测有两种主要的检测技术:误用
随着移动通信技术的飞速发展,越来越多的用户在日常生活中使用手机。为了提供移动服务,移动基站会时刻监测开机用户的当前位置以及时间戳。基于基站收集到这些用户移动信息,能够
计算机数控系统正在由封闭式体系结构向开放式模块化体系结构发展,PLC(Programmable Logical Controller,可编程逻辑控制器)是实现数控机床开关量控制功能的关键模块,和传统的硬
煤矿井下环境复杂,存在多种安全隐患。近年来我国煤矿事故频繁发生,造成重大人员伤亡和经济损失,现有的煤矿安全系统已经无法满足安全生产需要。无线传感器网络(Wireless Sen
RB模型是一种随机约束满足问题模型。基于RB模型产生的难解实例被广泛应用于算法竞赛和理论研究。本文从如下两个角度研究了RB模型的难解性。   1.首先,本文研究了RB模型的
无线传感器网络被认为是全球未来十大技术之一。由于它在许多领域具有重要的科研价值和实用价值,在基础理论和工程技术两个层面向科技工作者提出了大量挑战性问题,从而引起了学