基于神经网络的文本倾向性分析系统的研究与实现

被引量 : 0次 | 上传用户:xsh3310
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来,数以亿计的网民通过参与和自治,逐渐形成以新闻评论、BBS、聊天室、博客、维基、聚合新闻、微博等为代表的网络社区。广大网友以网上交流的形式已经形成了现今不容忽视的一大现象——网络舆情。对于网络舆情的研究是当前的一大热点。而对于网络评论的倾向性分析则是网络舆情研究中的重要课题。本文主要的创新点在于提出了对于情感词权重进行训练的思想;提出了基于神经网络的网络舆情文本倾向性分析系统,包括详细的算法部分以及引出的基于神经网络的情感词汇自动获取方法;整个算法在情感词词汇的自动获取方面能够做到全自动化,在篇章级的文本倾向性分析中的准确率较高,对于网络评论的倾向性能够进行全面系统的分析。在句子和篇章级的文本倾向性分析方面,研究者将主观文本的极性分为褒义和贬义两类。目前主要有两种方法:基于情感知识的方法以及基于特征分类的方法。基于情感知识的文本倾向性分析方法使用知识库得到情感词典或领域词典,然后进行极性加权求和的方法来进行分析。基于神经网络的网络舆情文本倾向性分析算法属于该类算法:在已有的词典基础上使用神经网络训练的方法对于情感词倾向值词典进行更新,从而能够反映最新预料的特征,改进网络评论的倾向性预测准确度。我们通过实验进行测试,证明了本算法能够达到较好的准确率。情感词词典的更新一直是文本倾向性分析中的重要的研究课题,然而现有的更新情感词词典的算法或多或少都会需要人工的参与。鉴于此,我们提出了基于神经网络的情感词汇自动获取方法,使用神经网络训练算法对统计得到的候选情感词进行训练,然后经过筛选得到更新后的情感词词典。本文对于算法进行了细致的描述,最后通过实验进行验证,证明了本算法能够自动获得情感词,同时对于文本倾向性的预测能够起到增加准确率的效果。最后,我们对于本文的工作进行了总结,同时对于将来的研究方向进行了展望,提出了几条后续的研究工作,望后续的学者能够继续本文的工作。
其他文献
在界定大学生自我管理概念的基础上,针对部分民办高校大学生自我管理能力欠缺的现状,通过青岛滨海学院的实践探索,给出民办高校提升大学生自我管理能力的对策。
3月30日下午,学院召开师职干部任命大会,政治部主任王庆年宣布了任职命令,新任职干部代表作了表态发言。会上,刘金增副政委代表学院纪委对新任职干部进行了集体廉政谈话,崔芝比政
本文基于产业融合视角对科特派企业精准扶贫的机理进行了分析,以秦巴山区科特派创业联盟企业为例,基于问卷调查,利用熵值法以MATLAB编程的形式对科技特派员创业企业的农业产
人文关怀的核心是以人为本,护理实践的核心是人,现代医疗服务强调以人和健康为中心,关注人的价值和需求。建立以体现人文关怀为核心的、满足病人身心需要、以恢复健康为目标
衣身结构平衡是指衣服在穿着状态中前、后衣身在腰围线以上部位能保持合体、平整,表面无造型所产生的皱褶。达到衣身整体结构平衡,关键是如何消除前浮余量。对原型结构中的胸省
中国经济持续了30多年高速增长后,许多学者开始担心中国经济是否会出现经济泡沫,因此研究日本泡沫经济形成和破灭机制具有重要的现实意义。本文运用宏观分析和统计数据、图表
在经济下行形势下,"担保圈"风险频发,互保企业面临或有负债风险和融资难的"两难"选择。贷款保证保险既为中小企业融资担保提供了新选择,也能够有效防止企业风险蔓延传染,是企
社交网络的出现深刻地改变了人们的生活。相比起传统媒体,社交网络为用户表达观点诉求提供了一个更加开放的平台。随着使用人数的剧增,社交网络也成为了中国大陆青年群体进行
集成电路封装是半导体产业链核心环节之一,随着集成电路工艺迅速发展,集成电路封装成为了制约集成电路性能的瓶颈。圆片级封装(Wafer Level Package, WLP)以圆片为加工对象,
饲料安全已成为各国关注的热点,我国饲料安全工程已经启动,由于我国饲料标准体系建设滞后,许多操作技术规范尚未建立,对于饲料添加剂和违禁药物的检验,仍然缺少权威性高、通用性强