论文部分内容阅读
近几年,各类社会舆情事件频发,特别是随着大数据时代的来临,社会舆情信息也凸显出海量、瞬刻、全息、价值低密、虚实莫辨的大数据特征,且成为政府决策的重要依据和数据来源。由于社会舆情研究的重要应用价值和实践指导意义,越来越多的学者开始对社会舆情信息的采集、处理、组织、分析、预警以及政府决策支持方面展开研究。就社会舆情信息采集及组织而言,它是分析的前提与基础,然而信息多源异构、价值低密的特性为有效采集和组织以及面向政府决策支持提供服务带来了诸多急需解决的问题和挑战。本文将面向政府决策支持解决社会舆情信息采集缺乏针对性、舆情信息缺乏语义化组织、舆情案例库描述粒度过大等相关问题。本文以政府决策者的实际需求为基础展开社会舆情信息的采集与组织研究,以面向政府决策支持为目标建立社会舆情案例知识库并设计社会舆情信息采集及组织系统原型。具体来讲,在理论与方法研究部分,本文综合运用语义关联、文献计量学、本体、自然语言处理、文本挖掘等理论与方法,首先,从用户需求出发,以政府决策的调研分析为基础,建立面向政府决策支持的舆情信息采集框架体系;其次,通过中文分词、词性标注、命名实体识别、情感提取等方法和步骤,研究社会舆情信息的语义特征抽取,实现对社会舆情信息细粒度的描述;再次,按照七步法并以ABC事件本体模型为参考构建适用于社会舆情信息描述的POIOM模型,并选择本体描述语言OWL以及本体构建工具Protege对社会舆情信息本体进行设计;然后,在分析现有舆情案例库的建设现状和存在问题的基础上,提出了基于关联组织的社会舆情案例知识库的设计方案,所建的案例知识库通过POIOM本体形成关联,构成一个有机整体。在实证研究部分,本文选取“南航急救门事件”与“南京小护士被打事件”两个典型案例,依据前文提出的采集与组织的方法实现社会舆情信息的采集、预处理、信息抽取和存储等操作,初步验证基于需求的采集方法和基于本体的组织方法的可行性和有效性。