论文部分内容阅读
随着互联网技术的飞速发展,各种社交网络平台尤其是移动社交网络平台持续增加,由此产生了海量的舆情信息。网络舆情具有明确的情感倾向性,并且其情感倾向极易传播与感染,甚至会影响事件的发展态势。因此,如何从庞杂的舆情信息中提取出热点话题,并分析各热点话题的情感倾向,对于发现公众关注焦点、提取舆情走势、把握舆论走向,并进一步引导正确的舆情传播方向、保障社会和谐稳定具有重要意义。
情感分析作为舆情分析最重要的环节之一,在传统方法中主要是借助情感词典与规则和浅层机器学习的方法来完成的。但是舆情信息句式复杂,隐喻、反讽较多,而传统的浅层学习方法难以获得较高的情感分类准确率。因此如何根据舆情信息的特点,进一步提高中文舆情信息的情感分类准确率,是目前舆情分析领域急需研究与解决的问题。针对传统情感分析的不足,本文采用深度学习的方法对中文情感分类问题进行了深入研究,并将其应用于网络舆情分析中,本文的主要研究工作如下:
(1) 在文本数据预处理中,基于词共现技术来训练词之间的语义联系,使用word2vec模型预训练词向量,解决了传统one-hot编码带来的维度灾难的问题,模型训练后得到低维稠密向量。
(2) 本文对现有的深度神经网络模型进行改进,提出了一种联合深度神经网络模型,将训练好的文本词向量输入卷积神经网络中自动提取文本高维特征,再根据文本序列的特点,将提取的高维文本特征输入长短时记忆神经网络中进一步学习文本远距离依赖特征。最后将该模型应用于2017年榆林产妇跳楼事件舆情中进行情感分类,对模型参数进行对比实验确定模型最优参数值,再将该模型与其他情感分析领域常用机器学习模型进行对比分析,验证了该模型的有效性。
(3) 针对舆情信息主题丰富、易随时间改变的特点,提出了舆情主题分析模型和舆情情感演化模型。使用LDA模型从一段时间内的舆情文本中提取主题,并根据转发量和评论数计算得到舆情热度值,得到热度最高的几个舆情主题。对特定热点话题相邻时间片内子话题之间的相对熵进行计算,判断相邻时间片内主题之间的关联程度,从而分析出是否有子话题的分裂、新话题的产生。再对评价对象进行抽取,结合联合深度神经网络模型对不同时间内各评价对象的情感进行判断,从多个维度对该热点话题的情感演化进行分析。
(4) 利用所提出的模型对2018年6月至7月30多万条网络舆情信息进行多维分析,同时通过增加主题特征进行融合提高了情感分类准确率,通过对比实验,验证了模型的有效性,对于舆情的时变性与舆情的主题演变得到了有价值、可借鉴的结果。
本文针对舆情信息的特点对现有的深度神经网络模型进行了改进,并在此基础上提出了舆情主题分析模型以及舆情情感演化模型,对热点话题进行提取并从热度、话题转移、情感演变等多个维度进行分析。本文提出的模型对舆情情感分析准确率的提高、舆情热点主题的提取以及热点话题的多维情感分析具有重要意义。
情感分析作为舆情分析最重要的环节之一,在传统方法中主要是借助情感词典与规则和浅层机器学习的方法来完成的。但是舆情信息句式复杂,隐喻、反讽较多,而传统的浅层学习方法难以获得较高的情感分类准确率。因此如何根据舆情信息的特点,进一步提高中文舆情信息的情感分类准确率,是目前舆情分析领域急需研究与解决的问题。针对传统情感分析的不足,本文采用深度学习的方法对中文情感分类问题进行了深入研究,并将其应用于网络舆情分析中,本文的主要研究工作如下:
(1) 在文本数据预处理中,基于词共现技术来训练词之间的语义联系,使用word2vec模型预训练词向量,解决了传统one-hot编码带来的维度灾难的问题,模型训练后得到低维稠密向量。
(2) 本文对现有的深度神经网络模型进行改进,提出了一种联合深度神经网络模型,将训练好的文本词向量输入卷积神经网络中自动提取文本高维特征,再根据文本序列的特点,将提取的高维文本特征输入长短时记忆神经网络中进一步学习文本远距离依赖特征。最后将该模型应用于2017年榆林产妇跳楼事件舆情中进行情感分类,对模型参数进行对比实验确定模型最优参数值,再将该模型与其他情感分析领域常用机器学习模型进行对比分析,验证了该模型的有效性。
(3) 针对舆情信息主题丰富、易随时间改变的特点,提出了舆情主题分析模型和舆情情感演化模型。使用LDA模型从一段时间内的舆情文本中提取主题,并根据转发量和评论数计算得到舆情热度值,得到热度最高的几个舆情主题。对特定热点话题相邻时间片内子话题之间的相对熵进行计算,判断相邻时间片内主题之间的关联程度,从而分析出是否有子话题的分裂、新话题的产生。再对评价对象进行抽取,结合联合深度神经网络模型对不同时间内各评价对象的情感进行判断,从多个维度对该热点话题的情感演化进行分析。
(4) 利用所提出的模型对2018年6月至7月30多万条网络舆情信息进行多维分析,同时通过增加主题特征进行融合提高了情感分类准确率,通过对比实验,验证了模型的有效性,对于舆情的时变性与舆情的主题演变得到了有价值、可借鉴的结果。
本文针对舆情信息的特点对现有的深度神经网络模型进行了改进,并在此基础上提出了舆情主题分析模型以及舆情情感演化模型,对热点话题进行提取并从热度、话题转移、情感演变等多个维度进行分析。本文提出的模型对舆情情感分析准确率的提高、舆情热点主题的提取以及热点话题的多维情感分析具有重要意义。