基于用户社交关系的微博情感分类模型研究

来源 :南京航空航天大学 | 被引量 : 3次 | 上传用户:cycblb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着IT技术的飞速发展,特别是Twitter和新浪微博等社交网络平台的兴起和蓬勃发展,微博文本情感分析(Microblog Sentiment Analysis,MSA)已成为一项热门的研究课题。然而,由于微博文本普遍篇幅短小,信息量少、数据噪声大等特点,给传统思维下的针对纯内容的文本情感分析方法带来极大的挑战。事实上,在线社交网络节点间存在大量链接结构,用户的情感和观点常常不自觉地受到其他用户节点的影响。近期研究表明,微博文本情感分析不再局限于传统的基于纯内容的分析,考虑融合有效的社交信息将有助于MSA取得更优效果。而web2.0鼎盛时期的到来,使得社交用户之间交互更加频繁、社交关系更加复杂紧密、情感交流和情绪影响更为普遍。同时,根据同质性和影响力等社会学理论可知,存在相似关系和影响关系的社交用户往往会对于某些事物或事实有相似的观点。因此,本文提出基于用户相似性(User Similarity)和用户影响力(User Influence)社交关系的微博文本情感分类模型(MSA-USUI模型)。根据社交网路节点相似性度量方法以及微博用户信息特性,提出分别从用户节点的网络结构、用户基本信息和用户兴趣三个维度来综合度量微博用户相似性关系;根据在线社交网络节点间影响力分析和度量方法以及微博用户行为特性,提出分别从好友关系和用户间互动行为两个角度来综合度量微博用户间影响力关系。在基于微博文本内容建模基础上,本文利用基于相似性关系和影响关系的用户社交关系构建微博文本间情感关系,并用“博文-博文”间情感关系进一步优化训练微博文本情感分类模型;对可能出现的过拟合问题进行处理,最终给出模型求解算法。最后,本研究通过python爬虫获取两个新浪微博数据集对模型进行实验验证,实验结果表明:MSA-USUI模型具有比支持向量机和目前先进的监督模型SANT有更好的微博情感分类效果。此外,实验结果还证明融合用户间影响社交关系信息带来的微博情感分类正确率和F1值提高大于融合用户间相似性关系信息,但当同时合理融合用户相似性关系信息和用户影响关系信息时,MSA-USUI模型的分类效果达到最优。
其他文献
跨区域发展给城市商业银行带来了前所未有的机遇和发展空间,各地城商行争先恐后的开始跨区域发展的步伐,跨区域发展在带给城商行带来丰厚的利润的同时,各种问题也随之而来。
农村住户调查工作是直接面向广大农户进行的调查,是科学制定农村政策的有力支撑。目前,各地农村住户调查工作存在一些共性问题,如配合程度不高,收入填写有所保留,记录汇总收
保育猪别名断奶仔猪,处在生长发育关键期,该时期生长发育快,抗病能力低下,极易感染多种疾病,故而加强饲养管理,做好疫病防治非常重要。而本文则对规模化猪场保育猪养殖管理技
从板材纹理识别的现实意义出发,简要概述了国内外研究的现状,对目前板材识别的方法和理论进行了探讨,并对板材纹理识别作了展望。
保育仔猪是指断乳至60~75日龄的仔猪,是哺乳仔猪由断奶顺利过渡到补料的重要饲养阶段,它是继哺乳仔猪管理后的另一重要生产阶段,搞好仔猪保育是提高生猪育成率和经济效益的关
随着我国经济的不断向前发展,人们的物质生活水平达到了显著提高,在衣食住行方面都提出了新的要求。猪肉,作为日常生活中最常见的肉食类型之一,它的卫生与否关系着人们的饮食
统计数据质量是衡量统计工作的核心指标,统计信息质量的高低直接影响和决定着数据的可利用性。当前,统计数据质量存在匹配性不够、及时性不足、可比性不强等问题。基层部门统
本文通过对公共项目与市场关系的分析以及公共项目多级委托代理链的分析,提出了公共项目治理的概念。由于公共项目委托代理链的特殊性,公共项目的治理结构应该是利益相关者的
电渗法是软土固结处理的有效方法,它通过在土体中插入电极并施加电场产生电渗流,土体排水发生固结从而提高强度。相对于传统固结的地基处理方法,其优势在于能使软黏土快速固
GPS技术的成熟使其成为对地观测的一种强有力的手段。GPS技术在大气观测和全球气候变化监测中应用的可能性使得GPS气象学(GPS/MET)成为一个崭新的极有潜力的研究方向。本文对GPS气象学及其分类作简