论文部分内容阅读
在“提速降费”的大背景下,移动通信网的井喷式跳跃发展,不仅提高了因特网的普及率,而且为人们相互交流提供了良好的平台,这使得网络成为群众表达社情民意、向外传达欲求、心声和交流情感的重要渠道。社会舆论网络化发展,使得突发事件的网络舆情扩散、爆发、引导变得愈加复杂。在突发事件网络舆情监管中,挖掘社交文本中存在的重要信息是工作的重点。其中的重要信息包括网络用户对评论突发事件时文本情感倾向以及事件的有关实体、实体属性和实体间关系。在针对文本的词向量表示问题上,论文提出了一种基于AME(Average Meta-embedding)的词向量表示方法。这种词向量模型融合了Word2vec和Glove词向量表示结果,一定程度上提升了文本情感分类模型性能。在针对文本情感识别问题上,论文提出了基于情感词典与自注意力机制的情感分析方法,避免了基于手工情感词典在处理大量社交文本时,因为词典覆盖面不全导致准确率偏低的情况,以及深度学习网络对目前有情感倾向的网络词的识别程度不够的问题。充分利用了情感词典在领域情感词方面的优势和深度神经网络模型在特征提取优势,减少了因单一模型自身的局限性。在针对突发事件分析与预测问题上,论文提出了基于知识图谱的方式来分析突发事件的组成要素及特征。从时序性和情感倾向性两个主要量化指标为切入点,通过层次聚类的方式找出事件相关话题,在使用Bi-LSTM-CRF模型对社交文本中实体及实体关系抽取构建事件的知识图谱形式,为进一步了解事件发展由来与趋势提供了有效的参考示例。通过定性与定量的对比实验,实验结果证明论文所提出的基于知识图谱的方法来分析突发事件和基于情感词典与自注意力机制的情感分析方法是可行的。