【摘 要】
:
随着人们不断在网络平台上发表对商品、人物、社会事件等的观点和评论,分析和挖掘这些海量舆论数据具有重要的实际意义,因此,关于网络文本数据的自动分类尤其是文本情感的自
论文部分内容阅读
随着人们不断在网络平台上发表对商品、人物、社会事件等的观点和评论,分析和挖掘这些海量舆论数据具有重要的实际意义,因此,关于网络文本数据的自动分类尤其是文本情感的自动识别方面的研究就显得尤为重要。本文主要对中文网络舆论的情感类别识别及情感强度的量化展开了研究,主要完成了以下工作:采用爬虫等方法获取真实的网络舆论语料;对语料进行预处理并完成各类语义词典的构建;采用Word2Vec实现语料的向量化表示;分别采用基于支持向量机和朴素贝叶斯等传统机器学习方法、基于循环神经网络和卷积神经网络及其变体的深度学习方法以及基于语义词典的方法实现网络舆论文本的情感识别,并对这三类方法做了相应的改进。其中,在基于机器学习的方法中又对如何进行特征筛选以及分类器的选取展开了重点研究;在基于深度学习的方法中,针对本课题的识别任务设计了一种混合深度神经网络模型TBLC-rAttention;在基于词典的方法中,又分别对语义词汇的相似度计算以及情感词典的自动扩展着重进行了研究;然后结合词典和深度学习这两种方法的优缺点,提出了一种基于深度学习和语义词典的二阶段中文文本情感识别模型。最后通过召回率、准确率和F1值等评价指标来分析各种模型的性能。实验表明,本文最终提出的二阶识别方法,完美的结合了词典和深度学习的优势,在维持最高识别性能的同时,又能实现了文本情感的数字化衡量。为了使得本文的研究成果可以更好的落实到实际应用,采用python、PyQt5在Spyder集成开发环境下开发了一款网络舆情识别系统。该系统可以自动完成对网络舆论文本的情感识别,并按照要求输出情感类别、情感强度得分、关键词/句、词云图等信息。为了方便识别器的修正,用户还可以使用自己的语料库重新训练模型。
其他文献
上海深水港工程东海大桥60m、70m预制箱梁,单片梁重最大达2000t,以滑移方式经横移、纵移将箱梁移运出海,采用大型海上起重船运输、架设。介绍箱梁滑移运输、架设方法及相应的技
为了精确研究滚筒印刷的张力特性及控制策略,建立了一个较精确的开卷张力动力学模型,利用MAT-LAB强大的建模、仿真功能,开发了一个开卷张力仿真模型,采用PID对其进行控制,由
巴黎气候大会之后,全球形成了推进碳减排的大趋势,电动汽车发展加快,预测石油消费峰值即将到来引起能源行业关注。在此背景下,石油行业面临着来自履行碳减排的社会责任,以及
<正>我们采用中西医结合的方法治疗慢性肾小球肾炎取得了显著疗效,现将1997—1999年收治105例总结如下:临床资料:本组病例均为我们研究所肾内科住院患者,其中男60例,女45例;
研究目的:民间传统体育组织在"项目保护传承、传统文化维护、生活治理改善和社会资本培育"方面发挥重要作用,但面临"组织合法性、生存性等困境"。随着传统文化复兴上升为国家
新时期国土空间综合交通体系规划是支撑空间发展战略实现和约束空间使用、优化空间结构、协调空间组织关系的重要手段和途径。首先,探讨国土空间全域、全空间、全要素的交通
随着应对气候变化的国际努力及能源低碳化越发成为共识,越来越多的国家在政策导向上积极推动可再生能源产业的贸易与发展。为了探索中国与东盟国家可再生能源产品的互补性,首
首先分析了电子商务在经济不景气的大环境下的发展状态,以及在电子商务迅猛发展的外部环境下,B2C电子商务模式的发展路径。在对B2C的概念、运行模式有了一定程度的解释后,以
<正> 我院自1998~2000年对23例小儿肱骨髁上骨折病人,采用切开复位克氏针内固定治疗,效果满意,现报道如下。1 临床资料1.1 一般资料 本组23例儿童,男16例,女7例。年龄4~11岁。
随着城市建设的快速发展,城市治理的难度逐渐加大,背街小巷的维护改造是城市治理的重要一环。以南京碑亭巷为例,从行人步行满意度的角度出发,通过实地观察、问卷调查等形式,