【摘 要】
:
随着互联网的蓬勃发展,各种在线社交媒体平台逐渐走进人们的视线中,新浪微博作为当下热门的社交软件,因其用户数量大、信息覆盖领域广而深受欢迎,网民可以通过微博实时分享对热点话题的看法,海量文本数据也因此源源不断的产生。在网络语言日益复杂的今天,与传统的粗粒度情感分析相比,方面级情感分析(Aspect-Based Sentiment Analysis,ABSA)能获取网民在特定话题下针对不同角度的情感倾
论文部分内容阅读
随着互联网的蓬勃发展,各种在线社交媒体平台逐渐走进人们的视线中,新浪微博作为当下热门的社交软件,因其用户数量大、信息覆盖领域广而深受欢迎,网民可以通过微博实时分享对热点话题的看法,海量文本数据也因此源源不断的产生。在网络语言日益复杂的今天,与传统的粗粒度情感分析相比,方面级情感分析(Aspect-Based Sentiment Analysis,ABSA)能获取网民在特定话题下针对不同角度的情感倾向,从文本中挖掘到更全面、更丰富的信息,这不仅能为企业提供营销和管理决策,还能协助国家、政府机构及时监管当前舆论走向,因此对微博文本进行方面级情感分析具有现实意义。单一的深度学习模型如循环神经网络(Recurrent Neural Network,RNN)和卷积神经网络(Convolutional Neural Network,CNN)在ABSA任务中存在局限性,无法充分提取文本特征,本文以微博文本为主要研究对象,在RNN和CNN模型的基础上进行了相关改进来提高模型性能,主要工作内容如下:(1)通过爬虫技术获取微博特定词条下的所有评论文本,并针对微博文本的特点进行数据清洗,对评论文本进行子句切割,通过程序和人工操作对数据集进行方面标注和情感极性标注,制作包含各方面的微博文本数据集。(2)针对单一的RNN无法提取文本局部特征以及单一的CNN无法学习长期依赖关系的问题,本文提出了一种基于双通道特征提取的AG-GCNN模型,该模型通过塔式结构使用文本卷积神经网络(Text Convolutional Neural Network,Text CNN)和双向门控循环单元(Bidirectional Gate Recurrent Unit,Bi-GRU)模块并行地从局部和全局关系上较为完整的提取特征,在一定程度上减少了特征的丢失,模型引入了门控机制和注意力机制进一步过滤与方面词无关的上下文信息,同时在特征提取阶段嵌入了方面词信息,充分实现特定方面与上下文之间的交互。相比起基准模型,本文提出的AG-GCNN模型在公开数据集Sem Eval2015上的分类性能有所提升,对比实验证明了模型的有效性。此外,AG-GCNN模型在制作的微博数据集上也表现出了良好的分类效果,实验结果验证了模型的实用性和泛化性。(3)本文利用基于词频统计的方法并结合人工筛选来初步提取评论文本中的方面词,再将提取的方面词进行聚类得到针对特定微博话题的多种方面类别,同时对话题各方面的评论情况进行统计汇总与分析,得到网民对话题的看法与情感倾向,并对该社会话题折射出的问题提供了相关建议。
其他文献
铁凝早期成名作《哦,香雪》以精妙的叙事构建了一个极具张力的空间场域。在此空间书写下,象征开放与封闭的城市与台儿沟、现代人的生存状态与情感流变,同主人公香雪在空间转换与并置中的价值选择与精神追求交织在一起。作者在表征“启蒙理性与人道主义”的《哦,香雪》这一文学文本中审美化地与读者进行对话。
云计算是继分布式计算、并行计算和网格计算之后出现的又一种新型服务计算模式,它是将计算资源、存储资源和软件资源等应用资源通过虚拟化技术存储到云端,由云计算服务提供商CSP进行管理与控制,通过多租户技术实现“分散资源的集中管理与集中资源的分散服务”。由于云资源服务提供者将资源从可信域迁移到不可信域后,就失去了对资源的控制,数据的安全存储、完整审计以及加密访问控制就成为云安全领域研究的关键问题。云计算的
在第四次工业革命的背景下,新技术的产生和应用使得知识的生产速度更加迅猛,更新迭代更加频繁。企业要紧跟时代的发展,不仅要引进掌握新技术、新知识的人才,还需要对员工进行再培训。湖南三一工业职业技术学院(简称三一工学院)是三一集团创办的企业大学,承担着培训全球员工和服务生态链的职能。随着企业数字化和实现3000亿的战略目标,现有的培训体系已不能满足发展需求,急需优化完善。通过大量阅读人才培养和培训相关文
近年来,林业有害生物发生频繁,危害严重。笔者分析了林业有害生物发生的原因有气候异常、缺乏重视、预防措施不够、人员不足等,并从加强宣传、营林措施、建立健全监测预警系统、加强检疫执法、生物防治技术、物理防治技术等方面提出了林业有害生物的无公害防治措施,以期为保护森林健康,维护生态平衡,促进林业资源的可持续发展提供参考。
<正> 一九八○年六月三十日至十五日,广西壮族自治区科委、区商业局等单位,在梧州市召开了猪血浆蛋白酶解法生产水解蛋白注射液技
<正>《哦,香雪》是作家铁凝的代表作之一,于1982年获得全国优秀短篇小说及首届"青年文学"创作奖,现被选入高中语文统编教材必修上册第一单元。小说以一个北方偏僻的小山村台儿沟为叙述和抒情背景,通过对香雪等一群乡村少女的心理活动的生动描摹,叙写了每天只停一分钟的火车给一向宁静的山村生活带来的波澜。小说语言优美,描写精彩,人物鲜明,具有极高的文学价值。其中对人物语言描写中的叹词、语气词运用精妙,这些词
近年来,随着神经网络相关理论及算法的快速发展,卷积神经网络因强大的二维信息处理能力和良好的泛化能力,在机器视觉领域得到了广泛应用。但是,卷积神经网络算法的计算量大,部署在功耗、成本受限的嵌入式系统上,处理器无法提供充足的算力。为了提升嵌入式系统执行推理任务的效率,本文基于RISC-V指令集架构设计了一款卷积神经网络处理器,满足前向推理任务的算力需求,并且具备低功耗、低成本的优势。本文主要工作如下: