论文部分内容阅读
舆情监测是当前各级部门的一项重要工作。通过舆情监测,获取舆论的准确动向,已经成为必须进行的工作。BBS作为当前重要信息传播渠道,在舆论传播中起了很重要的作用,研究专门针对BBS这个特定领域的舆情监测也是十分有意义的工作。目前,对于BBS舆情研究多集中在两个方面,一是研究对校园网络舆论的引导策略,二是研究BBS舆情监测系统。已有的舆情监测系统多采用基于通用搜索引擎技术的信息采集分析方法,此方法属于主动采集信息的方法,信息采集较全,但存在信息采集周期较长,重复内容较多的问题,不能满足新形势下实时、高效、准确的新需求。因此,提出了一种能够准实时监测BBS舆情信息的技术。该技术主要从数据采集、数据预处理和数据分析三个方面设计系统架构。首先在对当前武汉地区的BBS架构特征进行提取的基础上,针对BBS架构的特点提出了准实时采集数据的方案。然后采用HtmlParser工具对采集回来的数据进行预处理,同时采用Solr为数据库搭建搜索引擎。最后从热点信息提取和舆情信息提取及预警分析三个方面进行数据挖掘,得到完整的检测系统。系统能够准实时对BBS进行监测,准确获取指定内容,高效检索采集数据,进而挖掘热点事件。研究不仅能够应用于高校舆情监测,也可方便的扩展到主流论坛系统的舆情监测。目前系统已经给有关部门使用了一段时间,反映效果较好。