论文部分内容阅读
当今网络化和大数据时代,社会媒体已成为舆情事件发生、发展与演化的重要阵地。研发基于社会媒体网上—网下实时交互的舆情态势精准感知与态势研判技术,提升突发事件应对处置的能力,既是学术研究的热点与难点,也是商业、社会乃至国家安全面临的急迫需求与重大任务。在此背景下,本论文基于社会媒体舆情事件的多源异构大数据信息,主要工作包括如下三个方面:(1)融合多源异构信息进行舆情事件影响分析。针对网络舆情数据多维度、多来源、信息异构化等内在特征,及现有舆情指标体系覆盖度不够、指标项选取难以多维量化和跨源融合等问题,提出了融合多源和异构信息的舆情事件影响量化评价体系。该体系融合了新闻网站、论坛网站及微博网站等多种数据源,设计了基于情感计算、文本挖掘和用户社会网络分析的评价指标项,并采用层次模糊评价方法进行多维指标权重计算,实现了数据与专家领域知识的有机集成。实验表明,本论文提出的量化评价体系,能够较为准确和全面地刻画网络舆情事件的影响,与事件发展过程有较好的符合度,优于基于单一来源的事件评价方法。(2)研究了面向舆情事件的实体词抽取与扩展演变挖掘。针对舆情事件发展过程中事件描述实体词动态变化的问题,提出了基于双层模型的事件描述实体词抽取方法,采用融合用户关联关系网络的查询词扩展方法对实体词进行自动扩展,实现了对事件演化过程中中文变体词的识别。并将所提方法应用于舆情事件的数据采集查询词扩展,在事件数据采集中得到了实验验证。实验表明,本论文方法提供了良好的实体词抽取效果,以及实体词扩展词和变体词识别结果,应用于舆情事件数据采集可提升数据采集的召回率,尤其是在事件描述关键词包含“屏蔽敏感词”的情况下效果明显。(3)研究了面向舆情事件的基于异质信息网络的社区和话题动态演化分析方法。针对舆情事件发展过程中用户与话题社区数量不确定、结构不连续及两者不能协同演化的问题,构建了基于异质信息网络理论的舆情事件用户社区与话题演化分析模型,实现了基于狄利克雷过程混合模型的异质社区的协同发现及演化。实验表明,论文构建的模型能准确地刻画舆情事件的动态社区演化过程,较好地解决舆情事件演化过程中社区数量自动学习、社区结构平滑演化、社区与话题协同发现等难题。