社交网络中情感分析技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:onionshen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析是舆情分析、热点挖掘、产品推荐等应用的重要基础。互联网,特别是社交网络,提供了丰富的情感信息。Twitter、Facebook及新浪微博正在快速发展,用户在这些社交网络的发言与行为深刻反映了他们的情感信息。然而,微博的文字短小,用户自身的行为也存在随意性等特点,使得传统的基于文本分析的情感分析方法难以适用。本文基于社会学的同质分析等理论,充分利用社交网络的网络特性,深入研究了基于用户关系特性的社交网络情感分析模型与方法。首先,针对用户博文结构化特征差、信息不足的缺陷,提出基于观点一致性的情感分析方法,实现用户级的情感分析。传统方法根据用户的博文内容判断用户的态度与情感。然而,微博用户之间的关系,如关注、转发等,本身又蕴含了丰富的信息。因此,新方法基于用户标签和共同好友,衡量用户之间的情感相似性,并根据影响力决定用户间行为数据的影响权重,最终,通过综合大量好友的信息,判断用户的真正情感。其次,针对许多用户社会关系信息缺失的现状,研究用户间隐含关系的挖掘机制,然后结合用户的显式关系,提出融合全面用户关系信息的情感分析方法,以支持博文级与用户级的情感分析。许多微博用户的显式关系仅仅反映了他们生活中的人际关系,不能反映他们对许多事件的真实情感。为此,运用社会学同质性理论,提出用户博文数据的相似性度量指标,结合博文之间的相似性、博文之间的回复关系、用户博文一致性等信息,推断用户间的隐含关系。在此基础上,进一步研究了融合全面用户关系信息的情感分析方法。基于来自新浪微博的数据集,实现并验证了以上工作的有效性。该数据集包含了新浪微博用户的社交关系数据、用户属性、用户行为数据等信息。实验结果表明,与现有方法相比,观点一致性方法的各项评测指标均更优,用户级的预测精度提高了16%。同时,在少量标注集的半监督环境下,融合用户关系信息的方法在博文级与用户级的预测精度上,至少提升了2%。总之,新方法通过分析用户的社会关系并挖掘隐含的用户关联,再与用户的显式关系相结合,获得了更准确的情感分析结果。
其他文献
本文详细分析了当前国内外相关领域的研究现状和发展方向,阐述了测斜系统的组成、工作原理、数学模型以及系统设计的原则和方法,研究了系统数学模型和软硬件实现方法,完成了
人工智能和机器学习的共同目标是让计算机在没有明确的程序指导下解决问题,因此在过去的几十年里,有关计算机代码的人工演化是一项迅猛发展的技术,各相关领域的人们都期望能有一
软件模式是近年来软件工程领域热门研究的课题,有效地解决了软件设计策略的复用问题,其目标是优秀文档化的软件系统设计成果,为软件设计人员提供类似于其他工程领域的设计手册。
软件行业的工业化趋势导致了构件的产生.能够像硬件系统那样,将部分软件组合起来构建软件系统,一直是软件行业多年来追求的目标.构件技术的出现,极大地满足了多个应用领域的
数字水印(digital watermarking)是数字图像版权保护的关键技术之一,它提供了对数字图像合法保护的方案.数字水印技术能够将信息隐藏于图像中,隐藏的信息能够明确地指出版权
布料动画模拟是当前图形学界的一个热点研究方向。早期的布料模拟通常用几何方法,模拟质量很差。广泛采用物理方法以后,布料动画技术得到了很大的发展。然而这些技术或者计算效
近年来,传统驱动单处理器计算性能提升的技术逐步接近极限,但应用的发展对处理器性能的追求是无止境的,基于此,众核体系结构成为越来越多的研究人员热衷的对象。由于当前体系
随着计算机应用的深入,软件项目的需求日益复杂且变更频繁,软件中间产品越来越多并且关系复杂,采用科学的配置管理思想,辅之以先进的配置管理工具,已经是必不可少的手段。本文在大
随着计算机和通信技术的发展,计算机对于人们的生活和工作变得越来越重要,如今网上购物、电子交易、网上炒股等已经十分普及。现代计算机和信息技术在改变人们的生活方式和提高
目前,全球电信业正在处于从现有网络向下一代网络(NGN)演进的巨大变革之中。与传统电信网络相比,下一代网络是一个开放的平台,它以IP为中心,是一个能够支持语音、数据和多媒体业务