论文部分内容阅读
网络对于高职院校学生具有极强的粘度和网络传播连锁效应,因此高职网络舆情的应对和处理就尤为重要。基于情感维度的大数据网络舆情情感倾向性分析的研究,可对高职院校网络舆情应对与处理进行实证分析。利用网络爬虫技术和机器学习技术方法对高职院校学生关注的网络舆情进行情感趋势和维度要素的实例分析,根据模型决策结果为高职舆情预警程度的判定、情感维度及状况提供参考。
问题的提出
新闻舆论工作是党的一项重要工作,舆论引导能力是国家治理能力的重要内容。随着社会对网络舆情重视程度的不断提高,很多学者对高校网络舆情涉及到的各领域问题进行了系统研究,包括高校网络舆情的传播路径、形成机制、影响效果、事前、事中和事后的应对与处理等方面。这些丰硕的研究成果无疑为高职院校网络舆情应对和处理提供了丰富的理论基础和知识背景支撑。但纵观这些研究,仍然存在一些不足之处。
首先,现有研究方法一般采用整体描述,缺乏有针对性的聚焦研究,特别是在实证研究方面缺少数据支撑,使得结果难以得到科学的验证;其次在研究内容上,现有的研究局限于事件本身而忽视了与之高度关联的社会结构和社会文化;最后,在研究视角上,现有的研究主要集中在学生思想教育方面,而忽视了情感维度分析对舆情形式的研判、预警和系统引导作用。综上所述,本文基于情感维度的大数据网络舆情情感倾向性分析的研究对高职院校网络舆情应对与处理进行实证分析,利用网络爬虫技术和机器学习技术对高职院校学生关注的网络舆情进行情感趋势和维度要素实例分析,根据模型决策结果为预警程度的判定,为情感维度及状况提供参考。
高职院校网络舆情模型构建
舆情理论分析
结合高职院校学生群体和网络平台的特点,可以发现:第一,高职学生的需求具有方向一致性和内容个性化的特点。一致性是指高职学生关注点的认同是类似的,个性化是指评论主体由于个体需求及所处环境不同,关注的具体问题不同;第二,高职院校网络舆情情感态度存在对立面且具有动态性,对于同一社会现象的评论风向往往存在3种情緒:正向情绪、负向情绪和客观情绪;第三,网络舆情情感态度表现出显性和隐基金项目:2019年度全国统计科学研究项目(2019LY69)性的特征。
基于情感维度的大数据网络舆情情感倾向性分析模型构建
1.构建情感维度变量
情感维度是指群体在网络舆论语境环境下,需要一些变量来指代情感态度的级别,如舆情强度、舆情情绪以及舆情关注对象。舆情强度变量标签使用低、中、高表示;舆情情绪使用中性、负向和正向表示;舆情关注对象使用切身利益、关注他人、关注社会表示。
2.分析模型构建基本流程
基于情感维度的大数据网络舆情情感倾向性分析模型构建步骤包括:利用requests模块和Xpath模块编写微博爬虫程序,使用SnowNLP模块进行中文分词和词性标注,构建情感词典、提取情感倾向词、测算微博舆情情感分值以及数据可视化。
3.舆情数据抓取
本文以2020年8月14目的微博热搜主题“北京高校秋季开学的疫情防控规定”为数据来源,利用Python语言编写的爬虫程序来抓取该主题下的转发数量、评论数量和具体文本内容以及点赞数量。截止到2020年8月22日,转发数量为2636条,评论文本为5547条,点赞数量为139007条。
4.利用抓取的微博数据进行情感分析
本文微博网络舆情文本分析库采用的是Pyhon第三方库中的Snow自然语言处理库。Snow自然语言处理库使用了基于字符生成的模型进行中文分词,利用三阶隐马算法进行词性标注,应用朴素贝叶斯算法进行文本分类,最后基于文本分级算法进行提取文本关键词。情感词提取利用构建的情感词典对该微博评论文本的情感词进行判别、抽取,将情感词映射到所属类型上,最后计算该网络舆情所包含的情感类别频次。
本文参考情感测算公式,计算文本中正向情绪词、负向情绪词以及中性情绪词的数量进行倾向性计算。微博评论抓取的分析结果集中在0.6以下,因此舆论风向倾向于消极,积极情感较为欠缺。
网络舆情应对与处理
从上述模型的分析结果看出,假如舆情表现出强烈的负向倾向,将会像导火索一样引爆某个群体,引导整个校园舆论论调的滚动方向。因此,高职院校网络舆情应对与处理应该考虑如下方法:
一是利用信息手段构建网络舆情情感分析系统,重视事前应对。本文通过程序设计构建了一个舆情分析模型,从结果来看能够比较真实地反映网络用户群体的思想动态。
二是利用网络舆情分析系统中的关键词抽取,找到学生诉求而消解误解和矛盾。在本文的模型分析中通过文本分析可以得到一些高频词汇,这些词汇背后往往蕴含着学生的诉求导向。
三是培养舆论领袖,引导“羊群效应”。从网络舆情的发展来看,在微博、朋友圈或自媒体上看到了热点事件后,部分学生一开始还是不会表现出积极的意识形态,但是在少数的学生个体表达完具有“感召力”的言论后,舆论论调迅速攀升。
问题的提出
新闻舆论工作是党的一项重要工作,舆论引导能力是国家治理能力的重要内容。随着社会对网络舆情重视程度的不断提高,很多学者对高校网络舆情涉及到的各领域问题进行了系统研究,包括高校网络舆情的传播路径、形成机制、影响效果、事前、事中和事后的应对与处理等方面。这些丰硕的研究成果无疑为高职院校网络舆情应对和处理提供了丰富的理论基础和知识背景支撑。但纵观这些研究,仍然存在一些不足之处。
首先,现有研究方法一般采用整体描述,缺乏有针对性的聚焦研究,特别是在实证研究方面缺少数据支撑,使得结果难以得到科学的验证;其次在研究内容上,现有的研究局限于事件本身而忽视了与之高度关联的社会结构和社会文化;最后,在研究视角上,现有的研究主要集中在学生思想教育方面,而忽视了情感维度分析对舆情形式的研判、预警和系统引导作用。综上所述,本文基于情感维度的大数据网络舆情情感倾向性分析的研究对高职院校网络舆情应对与处理进行实证分析,利用网络爬虫技术和机器学习技术对高职院校学生关注的网络舆情进行情感趋势和维度要素实例分析,根据模型决策结果为预警程度的判定,为情感维度及状况提供参考。
高职院校网络舆情模型构建
舆情理论分析
结合高职院校学生群体和网络平台的特点,可以发现:第一,高职学生的需求具有方向一致性和内容个性化的特点。一致性是指高职学生关注点的认同是类似的,个性化是指评论主体由于个体需求及所处环境不同,关注的具体问题不同;第二,高职院校网络舆情情感态度存在对立面且具有动态性,对于同一社会现象的评论风向往往存在3种情緒:正向情绪、负向情绪和客观情绪;第三,网络舆情情感态度表现出显性和隐基金项目:2019年度全国统计科学研究项目(2019LY69)性的特征。
基于情感维度的大数据网络舆情情感倾向性分析模型构建
1.构建情感维度变量
情感维度是指群体在网络舆论语境环境下,需要一些变量来指代情感态度的级别,如舆情强度、舆情情绪以及舆情关注对象。舆情强度变量标签使用低、中、高表示;舆情情绪使用中性、负向和正向表示;舆情关注对象使用切身利益、关注他人、关注社会表示。
2.分析模型构建基本流程
基于情感维度的大数据网络舆情情感倾向性分析模型构建步骤包括:利用requests模块和Xpath模块编写微博爬虫程序,使用SnowNLP模块进行中文分词和词性标注,构建情感词典、提取情感倾向词、测算微博舆情情感分值以及数据可视化。
3.舆情数据抓取
本文以2020年8月14目的微博热搜主题“北京高校秋季开学的疫情防控规定”为数据来源,利用Python语言编写的爬虫程序来抓取该主题下的转发数量、评论数量和具体文本内容以及点赞数量。截止到2020年8月22日,转发数量为2636条,评论文本为5547条,点赞数量为139007条。
4.利用抓取的微博数据进行情感分析
本文微博网络舆情文本分析库采用的是Pyhon第三方库中的Snow自然语言处理库。Snow自然语言处理库使用了基于字符生成的模型进行中文分词,利用三阶隐马算法进行词性标注,应用朴素贝叶斯算法进行文本分类,最后基于文本分级算法进行提取文本关键词。情感词提取利用构建的情感词典对该微博评论文本的情感词进行判别、抽取,将情感词映射到所属类型上,最后计算该网络舆情所包含的情感类别频次。
本文参考情感测算公式,计算文本中正向情绪词、负向情绪词以及中性情绪词的数量进行倾向性计算。微博评论抓取的分析结果集中在0.6以下,因此舆论风向倾向于消极,积极情感较为欠缺。
网络舆情应对与处理
从上述模型的分析结果看出,假如舆情表现出强烈的负向倾向,将会像导火索一样引爆某个群体,引导整个校园舆论论调的滚动方向。因此,高职院校网络舆情应对与处理应该考虑如下方法:
一是利用信息手段构建网络舆情情感分析系统,重视事前应对。本文通过程序设计构建了一个舆情分析模型,从结果来看能够比较真实地反映网络用户群体的思想动态。
二是利用网络舆情分析系统中的关键词抽取,找到学生诉求而消解误解和矛盾。在本文的模型分析中通过文本分析可以得到一些高频词汇,这些词汇背后往往蕴含着学生的诉求导向。
三是培养舆论领袖,引导“羊群效应”。从网络舆情的发展来看,在微博、朋友圈或自媒体上看到了热点事件后,部分学生一开始还是不会表现出积极的意识形态,但是在少数的学生个体表达完具有“感召力”的言论后,舆论论调迅速攀升。