【摘 要】
:
随着计算机技术的高速发展以及网络的普及,人与人之间的交流不再受到时间和空间的限制。相较于传统的沟通方式,人们更倾向于使用在线社会网络分享自己的生活,表达自己的观点
论文部分内容阅读
随着计算机技术的高速发展以及网络的普及,人与人之间的交流不再受到时间和空间的限制。相较于传统的沟通方式,人们更倾向于使用在线社会网络分享自己的生活,表达自己的观点。由此诞生出大量的社交应用,其中新浪微博以信息涵盖面广、数据传播速度快及人人均可参与的特点成为最受用户欢迎的社交媒体。在日常生活中,用户通过微博分享生活,并就新鲜事物表达自己的观点,因此微博文本数据很大程度上带有情感色彩。对于此类数据的分析可以把握用户的情绪状态及兴趣点,在分析舆论导向、政府决策或是商业领域均有较高的研究价值。本文主要研究为设计一套完整的微博情感识别方案。该方案主要通过情感词典匹配的方式实现微博情感分析。本文提出情感识别总体设计方案分为数据采集、文本处理和情感识别等部分。本文首先对目前流行的数据采集方法进行介绍,比较其优缺点,结合微博的特点选择网络爬虫作为数据采集方法。接着通过对微博数据的分析,设计文本预处理和中文分词方案。随后本文分析了传统的情感词典应用于微博文本情感识别的不足之处,提出了通过引入网络新词词典、微博表情词典以及微博领域情感词典,结合传统的情感词典,构建出应用于微博的综合情感词典进行情感识别的方法。并就网络词词典、表情词典和领域词典的构建作出详细介绍。接着对中文句式和词语搭配进行分析,设计出一套情感值计算规则。然后对情感识别方案进行系统设计和实现。最后将系统运行结果进行展示,同时进行对比实验,验证了在微博情感识别领域,本文提出的识别方法较之传统文本识别方法有着更高的准确度。
其他文献
大跨桥梁服役要求通常为一百年,为使桥梁满足使用年限要求,诸多学者开展了大量关于桥梁损伤识别的研究,应用各类信号分析技术对桥梁损伤状况进行判别。然而桥梁信号的非平稳
目的:探讨早期康复治疗对脑梗塞患者3个月后运动功能障碍的影响,并分析早期康复治疗的优点。方法:对90例脑梗塞患者随机分为治疗组和对照纽,两组均常规进行神经内科的药物治疗,治
本文通过对1995—2013年全球双边贸易数据分析以及建立全球贸易模型,对中国加入WTO前后以及美国主导的TPP与TTIP全球贸易框架达成后,国际贸易格局的变化以及对中国的影响进行研
目的:探讨语言训练对儿童孤独症(CA)的康复治疗效果。方法:将48例儿童孤独症患儿随机分为语言治疗组及对照组。针对治疗组不同语言障碍特点进行个性化语言治疗,治疗前及治疗6个月
目的:探讨早期宫外孕的超声诊断方法. 方法:临床确诊或手术证实的44例早期宫外孕患者的经阴道与经腹部超声检查结果加以分析.结果:显示附件区孕囊或附件区包块或附件区胚胎心
<正>2018年是我成为全国政协委员的第一年。我参加了三月召开的大会、4次常委会会议和京内新委员培训学习班,在全国政协这个大舞台上,认真学习、积极建言,收获满满。作为一名
小学英语教学中,教师应该调动孩子们学习的积极性和主动性,让孩子们在轻松愉快的氛围中学到知识,尽情享受学习的乐趣。文中讲述本人在小学英语课堂教学中如何激发学生学习英
鲜食型红薯相较普通红薯而言,其具有口感好、营养价值高等特点,近年来受到广泛大众的喜爱。本文从山东地区鲜食型红薯栽培技术探究入手,对其展开论述。
目的:三阴性乳腺癌作为异质性极强的恶性肿瘤,其病灶具有浸润性强、易复发转移、预后差等特点,在乳腺癌发病率中占15%-20%,其死亡率相当高。因目前尚无可针对性的治疗靶点,治
众所周知,肝脏是脂肪代谢的重要器官,在正常情况下,肝脏只含有少量脂肪,约占肝脏重量4%-5%,某种情况下肝脏的脂肪含量增加,当其脂肪含量超过肝脏重量的10%时即为脂肪肝,表现