论文部分内容阅读
社交网络中的意见领袖是指具有较高声望的用户,他们活跃在社交网络平台上,发布对社会热点的看法并对舆论进行引导。准确地识别意见领袖,能够帮助政府及时掌握舆情动向并控制网络舆情。当前,意见领袖挖掘方法大多是基于用户属性的方法或基于网络结构的方法,往往只考虑了用户的属性特征或行为特征,忽略了用户的关系特征。因此,本文对社交网络评论文本的情感分析技术进行了研究,从而更精确地得出用户的关系特征。同时,结合用户的属性特征和行为特征,提出了一种基于多特征融合的意见领袖挖掘方法。具体的工作如下:(1)本文提出了一种基于并行混合神经网络的评论文本情感分析方法。一方面,针对评论文本特征难以充分提取的问题,本文利用卷积神经网络提取文本的局部特征,利用融合注意力机制的双向长短期记忆网络提取与文本上下文相关的全局特征,并将两种特征进行充分融合;另一方面,针对分布式词向量缺少对情感信息和分类贡献度关注的问题,本文将情感权重融入到TF-IDF算法中,结合分布式词向量生成加权词向量。在新浪微博评论的数据集上评测该方法的性能,实验结果表明该方法的macro_F1值达到了90.75%,能够较为精确地识别社交网络评论文本的情感倾向。(2)本文提出了一种基于多特征融合的意见领袖挖掘方法。第一,该方法使用符号社交网络作为研究工具,通过赋予用户之间代表支持或者反对的关系符号,更加客观地反映现实社会的用户关系;第二,该方法使用变异系数法分配各个属性的权重,更加客观地确定属性综合值,避免了人为因素的影响;第三,该方法同时融入了用户的行为特征、关系特征和属性特征,能够综合衡量意见领袖的传播能力、支持度和活跃度。在新浪微博热门话题的数据集上评测该方法的性能,实验结果表明该方法的覆盖率、核心率和用户支持度均优于其他方法,能够较为准确地挖掘社交网络中的意见领袖。