基于模糊聚类算法的微博用户情感分析研究

被引量 : 0次 | 上传用户:zhang332974789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0技术的发展,社交网站不断扩展其功能,人们可以在网上尽情地发表自己的观点,释放自己的情感。微博作为近几年来互联网的新兴产物,其情感计算与分析已成为计算机学、自然语言学、人类心理学等社会计算工作的重要研究课题。本文首先研究了模糊聚类相关理论知识,并将其应用于腾讯QQ空间说说的情感分析,为下一步将模糊聚类应用于微博用户情感分类分析提供了可操作性。模糊聚类分析首先要将文本数据数值化,对微博博文信息进行情感计算。因此本文在网络爬虫的技术原理上设计了新浪微博专用数据采集系统,建立了微博源数据库。利用基于知网(HowNet)基础情感词集的词语相似度计算方法计算微博情感词权值,建立了微博情感词库。在情感词库的基础上,分析了包含否定副词和程度副词等修饰词的微博短语情感强度值,并结合短句、短句与短句之间的关系,通过相应的情感值运算方法,计算得出整条微博消息的情感值。最后筛选了50名用户在10个不同时间段的情感值作为原始数据矩阵,利用模糊聚类算法将50名用户进行动态分类,并生成动态聚类图,由图可知根据不同的λ阈值,可以有不同的分类,并用F统计量检验法计算出最佳分类,再利用SPSS对分类结果预测作出每个分类用户的情感走势图,以便更直观地分析用户的情感变化。本文创新点主要在于:抓住人类情感是模糊不定的特征,利用模糊聚类来对已经通过情感计算的微博信息进行分类分析,政府、商家或企业可以根据不同的需求得到不同的分类结果,从而采取相应的措施。
其他文献
结合武汉市某极重型交通荷载等级城市主干路设计项目中软土路基处理工程,详细介绍了水泥土双向搅拌桩的设计方案和施工工艺,根据成桩检测结果,各项检测和试验结果均满足设计
越南纺织业是越南传统的一个行业。对越南来说,这是至关重要的行业之一,纺织业提供人民必要的要求,解决社会劳动问题,特别是纺织业在出口方面占优势,创造条件发展国家经济,平
提到万科,几乎可以说是家喻户晓,它被称之为地产行业的翘楚.20多年来,其规范、透明的现代公司治理机制被视作行业标杆,创始人王石之于万科更是教父一般的存在.但随着万科与宝
本文分析了中东铁路站房建筑的历史背景,因城市格局的发展变化及高速铁路的不断发展,使得中东铁路沿线部分站房建筑面临废弃或拆毁,这些记录人们特定时代历史缩影的历史建筑,
当前国际社会和国内社会存在的各种负面文化形态和文化思潮不断对高校校园文化的建设提出挑战。只有在思想政治教育的引导下进行高校校园文化建设才能保证高校校园文化的社会
木质纤维材料特有的化学组成和结构,使其具有较高的强度和刚性,且为热的不良导体,在高温加工过程中由于导热慢,导致局部表面降解而细胞壁内部却很少受到影响。因此,在通常的
城镇供热系统的运行调控是确保用户供热质量和管网安全、稳定、经济运行的关键环节。目前低温热水地板辐射供暖方式的优势越来越多得被显现出来,其与散热器供暖方式共用一个
地理核心素养研究离不开地理的深度教学。深度教学是指教师借助一定的教学活动情境带领学生超越表层的知识符号学习,进入知识内在的逻辑形式和意义领域,挖掘知识内涵的丰富价
<正>战"疫"之声抛肝沥胆除危难,大国担当逆向行。悬壶济世百姓赞,且看华夏骨铮铮!战"疫"时刻20201月18日国家卫健委组织以钟南山为组长的国家医疗与防控高级别专家组,赶赴武
为了促使太极拳推手比赛回归本真,提炼出符合太极拳原理的技法,并运用到实际比赛当中,以太极拳推手新规则和传统太极拳技法为研究对象,采用文献资料法、逻辑分析法,结合新规