基于语义分析的中文微博情感分类研究

被引量 : 0次 | 上传用户:skoda0412
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0的出现使用户成为互联网信息的创造者和管理者,彻底地改变了互联网信息单向传播的模式。微博作为典型的Web2.0互联网应用,自引入国内以来,迅速发展成为人们分享和获取信息的核心社交平台。用户通过微博发表观点、表达情感,使互联网产生了海量的包含情感的文本信息。对微博进行情感分析研究,有助于微博监管、舆情发现、舆论引导和商业竞争情报分析等工作的实现。相对于传统文本,微博内容具有主题广泛、表达口语化以及语言碎片化等特点,针对于微博的情感分析会遇到更多的困难和挑战。目前国内关于中文微博情感分析方面的研究尚处于起步阶段,还有大量研究问题需要深入探讨解决。因此,对微博情感分析进行研究,具有较高的理论价值和应用价值。论文以新浪和腾讯微博消息作为研究对象,使用语义分析的方法探讨了中文微博情感分析相关技术,主要包括情感词典构建方法、中文微博情感分析方法以及文本(包括微博)的情感分析实验系统的设计和实现等内容。在情感词典构建研究方面,提出一种基于语义分析的中文基础情感词典构建方法,利用HowNet和SentiWordNet资源,将词语自动分解为多个义元后计算其情感倾向强度值,使用支持向量机构建微博情感分类器进行实验,实验结果表明该词典优于一般极性情感词典。在网络用语情感词典和表情符号情感词典构建方面,借鉴SO-PMI算法,采用基于语料统计的方法对相应候选词集进行情感权值计算。在微博情感分析技术研究方面,提出一种基于语义分析的中文微博情感分类方法。折中方法结合所构建的词典对文本进行依存句法分析,并构建情感表达式树,根据制定的规则计算微博的情感强度,根据强度值判断微博的情感倾向类别。实验结果验证了该方法的有效性,也表明所构建的表情符号情感词典和网络用语情感词典能够有效地增强情感分类器的性能。在文本(包括微博)情感分析实验系统设计和实现方面,利用构建的词典资源以及提出的情感分析方法,设计和实现基于C/S和B/S混合体系结构的文本情感分析的实验系统,对海量数据文本情感分析进行探讨。实验系统功能主要包括情感词典构建工具、语料管理工具、情感分类工具以及在线情感分析和可视化工具等。
其他文献
2012年1月1日,上海市营业税改征增值税试点正式启动,掀起了新一轮税制改革的大幕。此后,北京、湖北等部分省市又相继申请试点。在总结试点省份经验的基础上,国务院从2013年8月1日
<正>为探索反腐倡廉教育、文化阵地建设、理论研究等廉洁文化建设模式,贵定供电局创建和提炼了"阳光管理"廉洁文化品牌,为促进企业健康发展奠定基础为贯彻贵州省纪委及贵州电
江西吉安深圳大桥跨越井吉铁路干线,原设计跨径50+40+40=130m PC简支T梁,复测后发现原墩位正下方80m处有大量串珠式溶洞,为避开溶洞集中区,保护铁路安全,并在铁路规定的3小时运行
结构(构件)与机械(零件)失效的主要原因是断裂尤其是疲劳断裂,其造成的事故往往是灾难性的。据相关资料显示,焊接接头的疲劳断裂占整个焊接结构失效的70%~90%左右,疲劳破坏常始于接
人员绩效考核是人力资源管理的重要组成部分,对于优化配置人力资源、提高工作效率具有重大意义。但是在实际操作过程中,公务员的绩效考核没有根据考核对象进行分类,考核手段相对
随着顾客需求层次不断提升,企业品牌战略的实施和推广,品牌在顾客的消费过程中有着至关重要的作用,成为了维系消费者和企业关系的纽带和桥梁。如何才能在这种大形势下吸引并保持
本文以唐尼采蒂的喜歌剧《爱的甘醇》为研究课题,从初期浪漫主义歌剧风格特征的角度加以阐述概括,结合探讨形成这些创作面貌的历史和时代原因,分析该作品的浪漫主义的艺术特
随着计算机等现代技术的广泛应用,教学资料的收集和教学过程的形成都发生很大的变化。合理运用多媒体技术进行美术教学,是当前美术教学改革的关键。在电脑美术教学过程中,传
新疆东天山地区是我国重要的Cu-Ni-Au-Mo-Fe矿集区,分布有图拉尔根、葫芦、黄山、黄山东、黄山南、香山、土墩、白石泉、天宇等大批岩浆铜镍硫化物矿床,同时也发现有尾亚钒钛磁
大萧条的爆发令古典经济学的分析模式受到严重的挑战,凯恩斯学派占据了主流。同时,货币学派、奥地利学派等经济学思想不断发展与之竞争。但是,很多非凯恩斯主义的观点在很长的一