论文部分内容阅读
摘要:可预测性灾害的网络舆情在灾前即已形成,研究其中网民情感态度的引导策略具有重要的现实意义。以“山竹”台风中普通网民发布的微博数据为具体对象,按灾前、灾中和灾后三个阶段分析网民情感态度的演变趋势,并利用主题聚类分析探索不同情感态度背后的主题因素,最后提出可预测性灾害中网民情感态度引导策略的建议。研究发现,可预测性灾害中灾前和灾后阶段网民情感态度波动较大,存在引导空间。建议从灾前预警信息发布和灾害知识普及、应急物资供给保障、水电网设施的安全和抢修、社会化媒体平台的运用等方面完善网民情感态度的引导策略。
关键词:可预测性灾害;网络舆情;情感分析;主题聚类
★基金项目:江苏省研究生科研与实践创新计划项目“可预测性灾害中网络舆情特征及引导策略研究”(项目编号:KYCX19_0996);江苏现代信息服务业决策咨询研究基地资助项目“基于移动社交媒体的应急信息管理众包参与模式研究”(项目编号:NYJD217003)。
引言
在诸如台风、冰雹、暴雨、暴风雪等可预测性灾害的情境下,网络舆情在灾前预警阶段就已经开始形成,并贯穿于灾中处置阶段和灾后恢复阶段。与突发灾害相比,灾前预警阶段是可预测性灾害特有的阶段,其网络舆情中蕴含的网民情感态度将会直接影响社会民众应对灾害的情绪和心态,更会影响到政府应急管理部门在灾害各阶段的应急决策。因此,在可预测性灾害中及时正确地引导网民的情感态度,有利于提升社会民众应对灾害的整体士气,对政府应急管理部门的应急管理工作具有十分重要的现实意义。
近年来,网络舆情中的情感分析和主题挖掘研究获得了许多学者的关注[1]。有专注于具体分析技术的实现和改进的,例如Manek等人构造了一个特殊的吉尼系数来计算情感词权重、划分情感词等级,并通过支持向量机对情感词进行分类以提高情感分析的准确性[2]。钱进宝提出了一种融合情感向量模型的演化K-medoids情感动态分析方法,这种分析方法可以有效分析网民对热点事件的情感动态,克服了传统算法只能分析静态数据的缺陷[3]。王静茹和陈震提出了一种基于LDA模型的不同类型文本数据主题提取效果对比的评价方法,通过定量的主题提取效果进行对比研究,发现LDA模型在处理语义信息明确、逻辑关系合理的长文本数据时效果较好[4]。有偏重于在实际场景中对分析技术加以研究和应用的,例如Bai和Yu提出了一个包含三个阶段的结构化框架,用于检测灾后情境中受害者的负面情绪,包括识别与灾害相关的微博信息、提取负面情绪信息、引入机器学习方法跟踪预测灾民的负面情绪变化趋势,然后通过对雅安地震的实例分析,证明该框架对灾后救灾和应急管理具有一定的指导意义[5]。情感分析和主题挖掘往往会在研究中被结合起来用于更全面的舆情分析。例如Huang等人提出了一种弱监督情感分析的主题模型,这种模型能同时分析消息中的情感和隐藏在消息中的主题[6]。王灿伟提出一种基于主题聚类的海量微博情感分析方法,结合情感词典和表情符号计算微博情感值[7]。谭旭等人通过构造中文文本词向量解析模型和RAE深度学习模型来实现文本信息的高层特征提取和情感分类[8]。王秀芳等人则提出一种基于话题聚类及情感强度的微博舆情分析模型,实现微博话题快速聚类及情感强度量化计算,通过时序回归分析追踪预测热点话题的情感变化[9]。
不难发现,目前对于网络舆情中情感和主题的分析方法较为丰富,各类分析技术的研究也日趋成熟。但当前与灾害相关的网络舆情研究较少依据灾害事件的发生特点按阶段进行分析,更缺乏特别针对台风、暴雨这类具有明确灾前预警阶段的可预测性灾害的分析,尚未充分探讨此类灾害中网民情感态度的内在特征及其引导策略。本文研究即以2018年“山竹”台风为具体情景,基于其网络舆情中网民情感的演化趋势及背后的主题聚类分析,从时间和主题两个维度总结网民情感态度的关键影响点,进而探讨可预测性灾害中网民情感态度的引导策略。
1、研究设计
本研究从新浪微博上抓取与“山竹”台风相关的微博文本数据,通过情感正面概率值的计算统计和主题聚类等方法,对灾害中网民情感态度的演变趋势和情感态度背后的主题因素进行系统分析,然后基于分析结果对可预测性灾害中的网民情感态度的特征进行讨论,并针对性地提出具体的引导策略建议。
1.1 研究过程
本文研究具体的研究步骤以及用到的研究方法和工具阐述如下:
① 研究数据的获取和预处理:本研究通过专门的舆情大数据管理软件从微博平台上抓取与“山竹”台风相关的微博文本原始数据。自行编写Python程序去掉重复、无效的内容,并对剩余的文本数据进行编分词、去停用詞等预处理。
② 网民情感演变趋势分析:通过Python程序调用适合中文文本分析的SnowNLP包,计算出每条微博文本的情感正面概率值。该值介于0到1之间,代表文本拥有正面(积极)情感态度的概率;然后按照灾前、灾中和灾后的阶段划分对情感数据进行统计分析,绘制图表来探讨网民情感态度演变的趋势。
③ 网民情感主题聚类分析:分别对消极情感和积极情感的文本数据进行主题聚类分析,即通过Python程序调用LDA(Latent Dirichlet Allocation,隐含狄利克雷分布)包对文本进行特征词抽取,归纳出主题,然后根据灾害发生阶段和不同情感态度,分别探讨主题演化的特征。
④ 讨论与建议:基于上述对“山竹”台风微博数据的情感和主题分析,进一步探讨网民情感态度演变的深层原因,并提出可预测性灾害中网民情感态度引导的策略建议。
1.2 研究数据
从微博搜索“山竹”台风的结果来看,最早的灾害信息在2018年9月7日出现,网民对“山竹”台风的关注一直持续到十月初。因此,本文研究数据获取的范围是微博上2018月9月7日至30日与“山竹”台风相关的微博文本数据,总计38272条。经过对原始数据中无效、重复的数据进行剔除,包括非普通网民发布、纯转发等对本研究没有价值的博文,最终筛选出9634条有效数据作为最终研究数据集。根据可预测性灾害的特征,我们将研究数据集分为三个部分:灾前阶段(9月7日至15日)、灾中阶段(9月16日)和灾后阶段(9月17日至30日),三个阶段的数据量分别为:灾前阶段3583条,灾中阶段4140条,灾后阶段1911条。 2、网民情感演变趋势分析
本文研究的最终目标是探讨网民情感态度的引导策略,因此以情感分析为主线。为了得到合理的积极、中立、消极对应的情感正面概率区间,随机抽取了1000条数据,通过人工方式对它们进行极性标注,然后与程序计算所得的情感正面概率值进行比对分析,最终确定情感正面概率值在(0,0.4)区间内的文本信息为消极情感,在(0.4,0.6)区间内的为中立情感,在(0.6,1)区间内的为积极情感。
2.1 网民情感态度极性占比分析
为了准确掌握网民在“山竹”台风的各个阶段中情感态度的变化规律,本研究首先分阶段统计含有消极、中立和积极情感的数据占比,结果如图1所示。
通过图1可以看出,在此次台风的各个阶段中带有积极情感的数据量占比均超过了50%,说明网民在此次灾害中的情感态度总体上是积极乐观的。但是,三种情感极性占比在灾害发展的不同阶段也有较为明显的变化,含消极情感极性的数据占比先增后减,灾前阶段是26.43%,灾中阶段时增加到29.8%,而到灾后阶段则降至20.46%。相比之下,含积极情感极性的数据占比是先减后增,灾前阶段是60.23%,灾中阶段降低为55%,到灾后阶段又大幅增加至69.81%。且灾前各情感占比值均位于灾中和灾后之间,灾前情感较不稳定,存在较大的引导空间。
2.2 网民整体情感态度演变趋势
在可预测性灾害中,网民的情感态度在灾前阶段已形成,且网民情感态度的变化会通过影响网络舆情的情感态势而影响其他网民的言论和行动。为了分析“山竹”台风中网民整体情感态度的演变趋势,本研究根据先前得到的每条数据的情感正面概率值,按照日期计算出每日的情感正面概率均值,并绘出其演变趋势图,如图2所示。
从图2可以看出,在“山竹”台风的整个网络舆情环境中,网民的情感正面概率均值都高于0.6,网民整体的情感态度偏向乐观。但网民情感正面概率均值在9月8日、9月16日达到了低谷,其中9月8日是灾害信息刚发布的时间,网民突然得到灾害预警,盲目恐慌导致情感正面概率均值迅速下降;9月16日是“山竹”台风正式登陆的时间,属于灾中阶段,受灾群众切身感受到了台风灾害的威力,导致网民情感正面概率均值大幅下跌。
2.3 网民消极和积极情感态度演变趋势
在“山竹”台风发生的整个过程中,网民整体的情感态度偏向乐观,积极情感成为整个阶段的主导情感极性,对网络舆情的走向具有重要影响。但也不能忽略网民的消极情感态度,因为这些消极的情感态度如果不能及时被引导和消解,很可能发酵形成不良的舆论导向,对灾害中的社会稳定形成冲击。因此,本研究专门针对网民情感正面概率值处于消极范围(0,0.4)的数据和处于积极范围(0.6,1)的数据进行分析,分别计算出它们的日均情感正面概率值,并绘制出消极和积极情感态度演变趋势图,如图3所示。
从图3可以看出,无论是消极情感还是积极情感,在灾前阶段和灾后阶段变化波动都比较大,原因在于灾前阶段和灾后阶段时间跨度较长,网民的情感态度受主观因素、外部舆论环境和周边社会环境的影响。因此,灾前阶段和灾后阶段的网民情感态度都存在较大的引导空间,政府应急管理部门应充分重视这两个时间段,积极开展相应的舆情引导工作,以及时消解网民的消极情感态度,形成更加积极的舆情环境。
3、网民情感主题聚类分析
上述研究理清了“山竹”台风中网民情感态度的演变趋势,给网民情感态度的引导提供了时间依据。为了更加有效地引导网民的情感态度,还需要进一步探究网民不同情感态度背后的真实原因,找出网民情感态度引导的主题依据。为此,本研究基于“山竹”台风的三个发展阶段,分别对消极情感态度和积极情感态度的微博数据进行主题聚类分析,探究与网民不同情感态度相关联的主题。
3.1 消极情感态度下的主题聚类分析
表1按照灾前、灾中和灾后三个阶段展示了网民消极情感態度下的主题聚类结果,可以看出,与网民消极情感态度相关的主题较为集中。在灾前阶段,引起网民消极情感态度的微博主题主要集中于灾前预警信息的发布、灾前物资供应短缺和停电停水等问题;在灾中阶段,网民对台风的正式登陆、航班停运、停电停水断网和建筑物不安全等问题表现出了消极情感态度;在灾后阶段,让网民产生消极情感态度的主题依然包括停电停水。
3.2 积极情感态度下的主题聚类分析
表2按照灾前、灾中和灾后三个阶段展示了网民积极情感态度下的微博主题聚类结果,与消极情感态度的主题聚类结果相比较,网民积极情感态度涉及的主题相对较为分散,涉及建筑、人文关怀、政府效率和社会集体荣誉感等方面。在灾前阶段,政府教育相关部门发布的停课停工通知、人们为灾区群众祈福大大缓解了台风给网民带来的恐惧,与去年的“天鸽”台风对比也给网民带来一定的心理缓冲,这些主题都催生了人们积极应对台风的心态;在灾中阶段,除了停课、为灾区群众祈福之外,学校的人文关怀、社会工作人员热衷奉献的精神等成为积极情感主题的主导,例如为灾中坚持工作的人点赞、高校送餐到宿舍、港珠澳大桥成功抵抗台风等;在灾后阶段,积极情感相关的主题包括穿越丛林上班、灾后恢复速度迅速、自愿绿色出行、教育孩子敬畏自然、临时避灾人员留感谢信等。
4、网民情感态度引导策略建议
上文“山竹”台风具体情境下网民情感演变趋势和主题聚类分析结果再次突显了政府应急管理部门对网民情感态度引导的重要性,特别是在具有灾前预警阶段的可预测性灾害中。网民情感演变趋势的分析结果显示,可预测性灾害中灾前预警阶段持续时间较长,网民的情感态度很容易受到外部舆论环境的影响,存在较大的引导空间。因此,在可预测性灾害的灾前预警阶段进行及时有效的网民情感态度引导,将会对灾前群众恐慌情绪的控制、预防工作的有序布置、灾中及时有效的救援、灾后的快速恢复产生重要的影响。进一步结合主题聚类分析挖掘出的网民不同情感背后的各类主题因素,本研究针对可预测性灾害中网民情感态度的引导策略提出以下四点建议:
第一、权威的灾前预警与灾害知识普及相结合
从灾前消极情感态度下的主题聚类分析结果可以看出,灾前预警信息可能会引起网民的盲目恐慌。当官方的灾前预警信息发布后,网民或自媒体会进行大规模转发,在此过程中,有些新闻媒体或网络自媒体会大肆夸大甚至编造台风灾害带来的危害。同时,绝大部分普通网民对台风灾害的相关知识了解甚少,缺乏理性的认知,容易受到不实信息的误导,结果导致大量无用、不必要的消极言论肆意蔓延,造成灾前社会环境的混乱。因此,在可预测性灾害的灾前阶段,政府应急管理部门应当首先加强官方信息的权威性,通过权威的官方媒体渠道及时发布和更新灾害预警信息。其次,政府应急管理部门也应加强相关灾害知识的普及工作,通过多种渠道发布与灾害相关的基础科学常识、防范知识和应急救援知识,从而引导普通网民理性看待灾害和从容应对灾害。总之,将权威的灾前预警与灾害知识普及相结合可以安抚网民对于灾害的恐慌心理,有助于消解网民的消极情绪,也有利于更好地开展防灾工作。
第二、充分重视灾前应急物资供给
从普通民众的角度来看,准备好应对灾害的各种生活物资是灾前防范措施中的重要内容。绝大多数人的灾前物资储备意识较强,会在预警阶段准备维持日常生活的必需品。所以灾前应急物资供给一旦出现短缺现象,就会引起广大民众的恐慌性抢购,这一点在消极情感态度下的主题聚类分析中有明显的体现。因此,在可预测性灾害中政府应急管理部门应充分重视灾前的应急物资供给,将应急物资准备和调配作为灾前阶段的一项重要工作。应急管理部门可以与各路商家一起统筹合作,建立灾前应急物资管理系统,根据各地区上报的应急物资储备量,结合人口密度、区域面积等进行合理的应急物资调配,为群众积极应对灾害提供充分的物资保障。
第三、提高水电网设施安全度及抢修效率
由消极情感态度下的主题聚类分析结果还可以看出,停电停水断网问题贯穿于整个灾害过程中,是造成网民消极情感态度的重要原因之一。在目前生活水平普遍提高的背景下,停电停水断网将会严重影响人们的正常生活。灾害期间停电停水断网的主要原因可能包括:为了避免人员由于触电造成伤亡;水电网设施抵抗自然灾害的能力的不足;抢修速度及抢修服务的效率低下。因此,在可预测性灾害中政府应急管理部门应提前关注水电网设施的安全度,并努力提高它们的抢修效率。例如,在灾前阶段做好水电网设施的检修工作,在安全的前提下尽量保证灾区群众日常生活中的用水用电用网;在必须停水停电的情况下,要做好提前通知和民众情绪安抚等工作,最大程度地争取群众的谅解和支持。
第四、利用好社会化媒体平台,积极与广大网民沟通
从“山竹”台风中网民积极情感态度下的主题涵盖范围来看,网民的积极情感大多是由于政府应急管理部门正确的应急决策和正面的主题宣传激发的,例如“教育局发布停课通知”、“赞美灾中工作人员”、“港珠澳大桥成功抵抗台风”、“自发绿色出行”等,说明应急管理部门的工作受到越来越多的网民关注,网民期望及时得知官方的应急决策,也会自发地参与、支持政府的应急管理工作。因此,政府应急管理部门在着力应对灾害的同时,也须利用微博、微信等社会化媒体平台及时发布各项重大的应急决策和救援进展信息,及时澄清或纠正失实的言论,宣传成功的典型应急案例,营造积极乐观的救灾氛围。除此之外,政府应急管理部门也可以充分利用社会化媒体与网民展开交流,收集网民的各种反馈和建议,把握住灾害应对过程中事关群众利益的关键问题。这些措施可以鼓励广大网民积极参与到灾害的应急过程中,有利于提高网民对政府应急管理部门的信任与支持,同时也鼓励网民更加积极地配合政府的应急救灾工作。
5、结论
为了探析可预测性灾害中针对普通网民情感态度的有效的引导策略,本文研究以“山竹”台风为具体情境,对普通网民在微博上发布的相关博文进行情感态度演变趋势的分析,并在不同情感态度下深入挖掘态度背后的主题信息。分析结果显示:网民在此次灾害中的情感态度总体上是积极乐观的,但是在灾前阶段和灾后阶段情感态度波动较大;与网民消极情感态度相关的主题较为集中,主要包括灾前预警信息、应急物资短缺和停水停电等;而网民积极情感态度涉及的主题则相对较为分散,涉及停课停工、祈福活动、应急工作人员的奉献精神、灾后的绿色出行等等。基于上述分析结果,本研究最终从灾前预警信息发布和灾害知识普及、应急物资供给保障、水电网设施的安全和抢修、社会化媒体平台的运用等角度提出了网民情感态度的引导策略建议。需要指出的是,本文研究的情感分类限于消极、中立和积极,其情感区分度较为有限,不能深入挖掘网民更为丰富的情感态度,这是本文研究的不足之处,也是我们研究团队下一个努力的方向。
参考文献:
[1] 孔建华.国内网络舆情治理研究综述[J].电子政务,2018(12):67-78.
[2] Manek A S, Shenoy P D, Mohan M C, et al. Aspect term extraction for sentiment analysis in large movie reviews using gini index feature selection method and SVM classifier[J].World Wide Web, 2017, 20(2): 135-154.
[3] 钱进宝.基于演化K-medoids方法的微博情感动态分析——以《穹顶之下》为例[J].情报杂志,2019,38(03):155-159+165.
[4] 王静茹,陈震.基于隐含狄利克雷分布的文本主题提取对比研究[J].情报科学,2018,36(01):102-107.
[5] Bai H, Yu G. A weibo-based approach to disaster informatics: incidents monitor in post-disaster situation via Weibo text negative sentiment analysis[J].Natural Hazards,2016,83(2):1177-1196.
[6] Huang F, Zhang S, Zhang J, et al.Mutimodal learning for topic sentiment analysis in microblogging[J].Neurocomp uting,2017,253:144-153.
[7] 王灿偉.基于主题提取的海量微博情感分析[J].南京大学学报(自然科学),2017,53(03):549-556.
[8] 谭旭,吴俊江,徐磊,等.面向深度学习的多维度中文网络舆情分析[J].小型微型计算机系统,2018,39(07):1471-1477.
[9] 王秀芳,盛姝,路燕.一种基于话题聚类及情感强度的微博舆情分析模型[J].数据分析与知识发现,2018,2(06):37-47.
作者简介:
沈洪洲,管理学博士,副教授,南京邮电大学管理学院,研究方向:社会化媒体、网络舆情;
马巧慧,南京邮电大学管理学院硕士研究生,研究方向:网络舆情;
沈超,管理学博士,副教授,南京邮电大学管理学院,研究方向:网络舆情。
关键词:可预测性灾害;网络舆情;情感分析;主题聚类
★基金项目:江苏省研究生科研与实践创新计划项目“可预测性灾害中网络舆情特征及引导策略研究”(项目编号:KYCX19_0996);江苏现代信息服务业决策咨询研究基地资助项目“基于移动社交媒体的应急信息管理众包参与模式研究”(项目编号:NYJD217003)。
引言
在诸如台风、冰雹、暴雨、暴风雪等可预测性灾害的情境下,网络舆情在灾前预警阶段就已经开始形成,并贯穿于灾中处置阶段和灾后恢复阶段。与突发灾害相比,灾前预警阶段是可预测性灾害特有的阶段,其网络舆情中蕴含的网民情感态度将会直接影响社会民众应对灾害的情绪和心态,更会影响到政府应急管理部门在灾害各阶段的应急决策。因此,在可预测性灾害中及时正确地引导网民的情感态度,有利于提升社会民众应对灾害的整体士气,对政府应急管理部门的应急管理工作具有十分重要的现实意义。
近年来,网络舆情中的情感分析和主题挖掘研究获得了许多学者的关注[1]。有专注于具体分析技术的实现和改进的,例如Manek等人构造了一个特殊的吉尼系数来计算情感词权重、划分情感词等级,并通过支持向量机对情感词进行分类以提高情感分析的准确性[2]。钱进宝提出了一种融合情感向量模型的演化K-medoids情感动态分析方法,这种分析方法可以有效分析网民对热点事件的情感动态,克服了传统算法只能分析静态数据的缺陷[3]。王静茹和陈震提出了一种基于LDA模型的不同类型文本数据主题提取效果对比的评价方法,通过定量的主题提取效果进行对比研究,发现LDA模型在处理语义信息明确、逻辑关系合理的长文本数据时效果较好[4]。有偏重于在实际场景中对分析技术加以研究和应用的,例如Bai和Yu提出了一个包含三个阶段的结构化框架,用于检测灾后情境中受害者的负面情绪,包括识别与灾害相关的微博信息、提取负面情绪信息、引入机器学习方法跟踪预测灾民的负面情绪变化趋势,然后通过对雅安地震的实例分析,证明该框架对灾后救灾和应急管理具有一定的指导意义[5]。情感分析和主题挖掘往往会在研究中被结合起来用于更全面的舆情分析。例如Huang等人提出了一种弱监督情感分析的主题模型,这种模型能同时分析消息中的情感和隐藏在消息中的主题[6]。王灿伟提出一种基于主题聚类的海量微博情感分析方法,结合情感词典和表情符号计算微博情感值[7]。谭旭等人通过构造中文文本词向量解析模型和RAE深度学习模型来实现文本信息的高层特征提取和情感分类[8]。王秀芳等人则提出一种基于话题聚类及情感强度的微博舆情分析模型,实现微博话题快速聚类及情感强度量化计算,通过时序回归分析追踪预测热点话题的情感变化[9]。
不难发现,目前对于网络舆情中情感和主题的分析方法较为丰富,各类分析技术的研究也日趋成熟。但当前与灾害相关的网络舆情研究较少依据灾害事件的发生特点按阶段进行分析,更缺乏特别针对台风、暴雨这类具有明确灾前预警阶段的可预测性灾害的分析,尚未充分探讨此类灾害中网民情感态度的内在特征及其引导策略。本文研究即以2018年“山竹”台风为具体情景,基于其网络舆情中网民情感的演化趋势及背后的主题聚类分析,从时间和主题两个维度总结网民情感态度的关键影响点,进而探讨可预测性灾害中网民情感态度的引导策略。
1、研究设计
本研究从新浪微博上抓取与“山竹”台风相关的微博文本数据,通过情感正面概率值的计算统计和主题聚类等方法,对灾害中网民情感态度的演变趋势和情感态度背后的主题因素进行系统分析,然后基于分析结果对可预测性灾害中的网民情感态度的特征进行讨论,并针对性地提出具体的引导策略建议。
1.1 研究过程
本文研究具体的研究步骤以及用到的研究方法和工具阐述如下:
① 研究数据的获取和预处理:本研究通过专门的舆情大数据管理软件从微博平台上抓取与“山竹”台风相关的微博文本原始数据。自行编写Python程序去掉重复、无效的内容,并对剩余的文本数据进行编分词、去停用詞等预处理。
② 网民情感演变趋势分析:通过Python程序调用适合中文文本分析的SnowNLP包,计算出每条微博文本的情感正面概率值。该值介于0到1之间,代表文本拥有正面(积极)情感态度的概率;然后按照灾前、灾中和灾后的阶段划分对情感数据进行统计分析,绘制图表来探讨网民情感态度演变的趋势。
③ 网民情感主题聚类分析:分别对消极情感和积极情感的文本数据进行主题聚类分析,即通过Python程序调用LDA(Latent Dirichlet Allocation,隐含狄利克雷分布)包对文本进行特征词抽取,归纳出主题,然后根据灾害发生阶段和不同情感态度,分别探讨主题演化的特征。
④ 讨论与建议:基于上述对“山竹”台风微博数据的情感和主题分析,进一步探讨网民情感态度演变的深层原因,并提出可预测性灾害中网民情感态度引导的策略建议。
1.2 研究数据
从微博搜索“山竹”台风的结果来看,最早的灾害信息在2018年9月7日出现,网民对“山竹”台风的关注一直持续到十月初。因此,本文研究数据获取的范围是微博上2018月9月7日至30日与“山竹”台风相关的微博文本数据,总计38272条。经过对原始数据中无效、重复的数据进行剔除,包括非普通网民发布、纯转发等对本研究没有价值的博文,最终筛选出9634条有效数据作为最终研究数据集。根据可预测性灾害的特征,我们将研究数据集分为三个部分:灾前阶段(9月7日至15日)、灾中阶段(9月16日)和灾后阶段(9月17日至30日),三个阶段的数据量分别为:灾前阶段3583条,灾中阶段4140条,灾后阶段1911条。 2、网民情感演变趋势分析
本文研究的最终目标是探讨网民情感态度的引导策略,因此以情感分析为主线。为了得到合理的积极、中立、消极对应的情感正面概率区间,随机抽取了1000条数据,通过人工方式对它们进行极性标注,然后与程序计算所得的情感正面概率值进行比对分析,最终确定情感正面概率值在(0,0.4)区间内的文本信息为消极情感,在(0.4,0.6)区间内的为中立情感,在(0.6,1)区间内的为积极情感。
2.1 网民情感态度极性占比分析
为了准确掌握网民在“山竹”台风的各个阶段中情感态度的变化规律,本研究首先分阶段统计含有消极、中立和积极情感的数据占比,结果如图1所示。
通过图1可以看出,在此次台风的各个阶段中带有积极情感的数据量占比均超过了50%,说明网民在此次灾害中的情感态度总体上是积极乐观的。但是,三种情感极性占比在灾害发展的不同阶段也有较为明显的变化,含消极情感极性的数据占比先增后减,灾前阶段是26.43%,灾中阶段时增加到29.8%,而到灾后阶段则降至20.46%。相比之下,含积极情感极性的数据占比是先减后增,灾前阶段是60.23%,灾中阶段降低为55%,到灾后阶段又大幅增加至69.81%。且灾前各情感占比值均位于灾中和灾后之间,灾前情感较不稳定,存在较大的引导空间。
2.2 网民整体情感态度演变趋势
在可预测性灾害中,网民的情感态度在灾前阶段已形成,且网民情感态度的变化会通过影响网络舆情的情感态势而影响其他网民的言论和行动。为了分析“山竹”台风中网民整体情感态度的演变趋势,本研究根据先前得到的每条数据的情感正面概率值,按照日期计算出每日的情感正面概率均值,并绘出其演变趋势图,如图2所示。
从图2可以看出,在“山竹”台风的整个网络舆情环境中,网民的情感正面概率均值都高于0.6,网民整体的情感态度偏向乐观。但网民情感正面概率均值在9月8日、9月16日达到了低谷,其中9月8日是灾害信息刚发布的时间,网民突然得到灾害预警,盲目恐慌导致情感正面概率均值迅速下降;9月16日是“山竹”台风正式登陆的时间,属于灾中阶段,受灾群众切身感受到了台风灾害的威力,导致网民情感正面概率均值大幅下跌。
2.3 网民消极和积极情感态度演变趋势
在“山竹”台风发生的整个过程中,网民整体的情感态度偏向乐观,积极情感成为整个阶段的主导情感极性,对网络舆情的走向具有重要影响。但也不能忽略网民的消极情感态度,因为这些消极的情感态度如果不能及时被引导和消解,很可能发酵形成不良的舆论导向,对灾害中的社会稳定形成冲击。因此,本研究专门针对网民情感正面概率值处于消极范围(0,0.4)的数据和处于积极范围(0.6,1)的数据进行分析,分别计算出它们的日均情感正面概率值,并绘制出消极和积极情感态度演变趋势图,如图3所示。
从图3可以看出,无论是消极情感还是积极情感,在灾前阶段和灾后阶段变化波动都比较大,原因在于灾前阶段和灾后阶段时间跨度较长,网民的情感态度受主观因素、外部舆论环境和周边社会环境的影响。因此,灾前阶段和灾后阶段的网民情感态度都存在较大的引导空间,政府应急管理部门应充分重视这两个时间段,积极开展相应的舆情引导工作,以及时消解网民的消极情感态度,形成更加积极的舆情环境。
3、网民情感主题聚类分析
上述研究理清了“山竹”台风中网民情感态度的演变趋势,给网民情感态度的引导提供了时间依据。为了更加有效地引导网民的情感态度,还需要进一步探究网民不同情感态度背后的真实原因,找出网民情感态度引导的主题依据。为此,本研究基于“山竹”台风的三个发展阶段,分别对消极情感态度和积极情感态度的微博数据进行主题聚类分析,探究与网民不同情感态度相关联的主题。
3.1 消极情感态度下的主题聚类分析
表1按照灾前、灾中和灾后三个阶段展示了网民消极情感態度下的主题聚类结果,可以看出,与网民消极情感态度相关的主题较为集中。在灾前阶段,引起网民消极情感态度的微博主题主要集中于灾前预警信息的发布、灾前物资供应短缺和停电停水等问题;在灾中阶段,网民对台风的正式登陆、航班停运、停电停水断网和建筑物不安全等问题表现出了消极情感态度;在灾后阶段,让网民产生消极情感态度的主题依然包括停电停水。
3.2 积极情感态度下的主题聚类分析
表2按照灾前、灾中和灾后三个阶段展示了网民积极情感态度下的微博主题聚类结果,与消极情感态度的主题聚类结果相比较,网民积极情感态度涉及的主题相对较为分散,涉及建筑、人文关怀、政府效率和社会集体荣誉感等方面。在灾前阶段,政府教育相关部门发布的停课停工通知、人们为灾区群众祈福大大缓解了台风给网民带来的恐惧,与去年的“天鸽”台风对比也给网民带来一定的心理缓冲,这些主题都催生了人们积极应对台风的心态;在灾中阶段,除了停课、为灾区群众祈福之外,学校的人文关怀、社会工作人员热衷奉献的精神等成为积极情感主题的主导,例如为灾中坚持工作的人点赞、高校送餐到宿舍、港珠澳大桥成功抵抗台风等;在灾后阶段,积极情感相关的主题包括穿越丛林上班、灾后恢复速度迅速、自愿绿色出行、教育孩子敬畏自然、临时避灾人员留感谢信等。
4、网民情感态度引导策略建议
上文“山竹”台风具体情境下网民情感演变趋势和主题聚类分析结果再次突显了政府应急管理部门对网民情感态度引导的重要性,特别是在具有灾前预警阶段的可预测性灾害中。网民情感演变趋势的分析结果显示,可预测性灾害中灾前预警阶段持续时间较长,网民的情感态度很容易受到外部舆论环境的影响,存在较大的引导空间。因此,在可预测性灾害的灾前预警阶段进行及时有效的网民情感态度引导,将会对灾前群众恐慌情绪的控制、预防工作的有序布置、灾中及时有效的救援、灾后的快速恢复产生重要的影响。进一步结合主题聚类分析挖掘出的网民不同情感背后的各类主题因素,本研究针对可预测性灾害中网民情感态度的引导策略提出以下四点建议:
第一、权威的灾前预警与灾害知识普及相结合
从灾前消极情感态度下的主题聚类分析结果可以看出,灾前预警信息可能会引起网民的盲目恐慌。当官方的灾前预警信息发布后,网民或自媒体会进行大规模转发,在此过程中,有些新闻媒体或网络自媒体会大肆夸大甚至编造台风灾害带来的危害。同时,绝大部分普通网民对台风灾害的相关知识了解甚少,缺乏理性的认知,容易受到不实信息的误导,结果导致大量无用、不必要的消极言论肆意蔓延,造成灾前社会环境的混乱。因此,在可预测性灾害的灾前阶段,政府应急管理部门应当首先加强官方信息的权威性,通过权威的官方媒体渠道及时发布和更新灾害预警信息。其次,政府应急管理部门也应加强相关灾害知识的普及工作,通过多种渠道发布与灾害相关的基础科学常识、防范知识和应急救援知识,从而引导普通网民理性看待灾害和从容应对灾害。总之,将权威的灾前预警与灾害知识普及相结合可以安抚网民对于灾害的恐慌心理,有助于消解网民的消极情绪,也有利于更好地开展防灾工作。
第二、充分重视灾前应急物资供给
从普通民众的角度来看,准备好应对灾害的各种生活物资是灾前防范措施中的重要内容。绝大多数人的灾前物资储备意识较强,会在预警阶段准备维持日常生活的必需品。所以灾前应急物资供给一旦出现短缺现象,就会引起广大民众的恐慌性抢购,这一点在消极情感态度下的主题聚类分析中有明显的体现。因此,在可预测性灾害中政府应急管理部门应充分重视灾前的应急物资供给,将应急物资准备和调配作为灾前阶段的一项重要工作。应急管理部门可以与各路商家一起统筹合作,建立灾前应急物资管理系统,根据各地区上报的应急物资储备量,结合人口密度、区域面积等进行合理的应急物资调配,为群众积极应对灾害提供充分的物资保障。
第三、提高水电网设施安全度及抢修效率
由消极情感态度下的主题聚类分析结果还可以看出,停电停水断网问题贯穿于整个灾害过程中,是造成网民消极情感态度的重要原因之一。在目前生活水平普遍提高的背景下,停电停水断网将会严重影响人们的正常生活。灾害期间停电停水断网的主要原因可能包括:为了避免人员由于触电造成伤亡;水电网设施抵抗自然灾害的能力的不足;抢修速度及抢修服务的效率低下。因此,在可预测性灾害中政府应急管理部门应提前关注水电网设施的安全度,并努力提高它们的抢修效率。例如,在灾前阶段做好水电网设施的检修工作,在安全的前提下尽量保证灾区群众日常生活中的用水用电用网;在必须停水停电的情况下,要做好提前通知和民众情绪安抚等工作,最大程度地争取群众的谅解和支持。
第四、利用好社会化媒体平台,积极与广大网民沟通
从“山竹”台风中网民积极情感态度下的主题涵盖范围来看,网民的积极情感大多是由于政府应急管理部门正确的应急决策和正面的主题宣传激发的,例如“教育局发布停课通知”、“赞美灾中工作人员”、“港珠澳大桥成功抵抗台风”、“自发绿色出行”等,说明应急管理部门的工作受到越来越多的网民关注,网民期望及时得知官方的应急决策,也会自发地参与、支持政府的应急管理工作。因此,政府应急管理部门在着力应对灾害的同时,也须利用微博、微信等社会化媒体平台及时发布各项重大的应急决策和救援进展信息,及时澄清或纠正失实的言论,宣传成功的典型应急案例,营造积极乐观的救灾氛围。除此之外,政府应急管理部门也可以充分利用社会化媒体与网民展开交流,收集网民的各种反馈和建议,把握住灾害应对过程中事关群众利益的关键问题。这些措施可以鼓励广大网民积极参与到灾害的应急过程中,有利于提高网民对政府应急管理部门的信任与支持,同时也鼓励网民更加积极地配合政府的应急救灾工作。
5、结论
为了探析可预测性灾害中针对普通网民情感态度的有效的引导策略,本文研究以“山竹”台风为具体情境,对普通网民在微博上发布的相关博文进行情感态度演变趋势的分析,并在不同情感态度下深入挖掘态度背后的主题信息。分析结果显示:网民在此次灾害中的情感态度总体上是积极乐观的,但是在灾前阶段和灾后阶段情感态度波动较大;与网民消极情感态度相关的主题较为集中,主要包括灾前预警信息、应急物资短缺和停水停电等;而网民积极情感态度涉及的主题则相对较为分散,涉及停课停工、祈福活动、应急工作人员的奉献精神、灾后的绿色出行等等。基于上述分析结果,本研究最终从灾前预警信息发布和灾害知识普及、应急物资供给保障、水电网设施的安全和抢修、社会化媒体平台的运用等角度提出了网民情感态度的引导策略建议。需要指出的是,本文研究的情感分类限于消极、中立和积极,其情感区分度较为有限,不能深入挖掘网民更为丰富的情感态度,这是本文研究的不足之处,也是我们研究团队下一个努力的方向。
参考文献:
[1] 孔建华.国内网络舆情治理研究综述[J].电子政务,2018(12):67-78.
[2] Manek A S, Shenoy P D, Mohan M C, et al. Aspect term extraction for sentiment analysis in large movie reviews using gini index feature selection method and SVM classifier[J].World Wide Web, 2017, 20(2): 135-154.
[3] 钱进宝.基于演化K-medoids方法的微博情感动态分析——以《穹顶之下》为例[J].情报杂志,2019,38(03):155-159+165.
[4] 王静茹,陈震.基于隐含狄利克雷分布的文本主题提取对比研究[J].情报科学,2018,36(01):102-107.
[5] Bai H, Yu G. A weibo-based approach to disaster informatics: incidents monitor in post-disaster situation via Weibo text negative sentiment analysis[J].Natural Hazards,2016,83(2):1177-1196.
[6] Huang F, Zhang S, Zhang J, et al.Mutimodal learning for topic sentiment analysis in microblogging[J].Neurocomp uting,2017,253:144-153.
[7] 王灿偉.基于主题提取的海量微博情感分析[J].南京大学学报(自然科学),2017,53(03):549-556.
[8] 谭旭,吴俊江,徐磊,等.面向深度学习的多维度中文网络舆情分析[J].小型微型计算机系统,2018,39(07):1471-1477.
[9] 王秀芳,盛姝,路燕.一种基于话题聚类及情感强度的微博舆情分析模型[J].数据分析与知识发现,2018,2(06):37-47.
作者简介:
沈洪洲,管理学博士,副教授,南京邮电大学管理学院,研究方向:社会化媒体、网络舆情;
马巧慧,南京邮电大学管理学院硕士研究生,研究方向:网络舆情;
沈超,管理学博士,副教授,南京邮电大学管理学院,研究方向:网络舆情。