基于深度学习的短文本情感分类研究

来源 :河南理工大学 | 被引量 : 0次 | 上传用户:tszl8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随互联网的兴起及交互式网络的发展,大量文本信息随之产生并对网民的日常生活、各类商业及政府工作活动产生重大影响。为有效挖掘和处理有用的文本信息、解决人机互动等相关问题,研究人员开始对蕴含用户主观意愿的文本数据做相关技术处理,力图获得文本背后的情感信息,以便对用户抉择、企业升级、产品定位、政府民意调查及工作安排给予指导性意见和帮助。文本情感分类随之成为自然语言处理领域继机器翻译、文本引擎搜索和智能问答后的又一重要研究方向。传统对情感分析的研究通常是基于情感词袋模型和机器学习的使用,然而其需要海量专业知识和大量人工投入的缺陷使研究人员逐渐转向使用深度学习算法对其进行研究,本文在传统深度学习算法的基础上进行了一定的改良设计,使改良后的混合模型在分类准确率等多个指标上有一定的提高,验证本文所提出情感分类模型的有效性。本文首先对词向量模型、自然语言处理常用的机器学习算法、深度学习网络及注意力机制模型的相关知识进行了阐述,并对卷积神经网络、循环神经网络、长短时记忆网络、耦合输入和遗忘门网络模型(Coupled Input and Forget Gate,CIFG)、双向耦合输入和遗忘门网络模型(Bi-directional Coupled Input and Forget Gate,BICIFG)以及注意力模型(Attention Mechanism)的工作原理和处理过程进行详细的讲述。然后介绍了如何通过Word2vec模型训练词向量的操作方法和步骤,并对实验过程中所使用模型的参数进行说明,提升词向量的质量。最后本文对传统卷积神经网络进行改造,提出基于CNN-CIFG-Attention的网络模型,将耦合输入和遗忘门网络单元CIFG取代卷积过程中的池化操作,避免了部分有用的池化信息的丢失,并引入注意力层对原有词向量的权重进行重点分配,有效提高混合模型对重要文本情感信息的突出能力;并将CNN-Attention算法模型与BICIFG-Attention算法进行并行设计,提出基于双通道的CABAM(Dual-Channel of CNN-Attention and BICIFG-Attention Model,CABAM)网络模型,在网络爬取的文本测试集上进行评估,证明了所提出模型的有效性和改进方案的正确性。
其他文献
α-氧化铝是一种高熔点、高硬度、极具稳定性的材料,被广泛应用于填料、耐火材料、陶瓷建筑等领域,具有良好的市场开发前景和研究意义。文章介绍了α-氧化铝的结构和性质特点,归纳总结了α-氧化铝在不同领域中的应用前景,最后对α-氧化铝的应用进行总结与展望。
期刊
<正>一、超导材料概述超导材料,就是常说的“超导体(superconductor)”,主要是指某些金属、合金和化合物,当温度降到某一特定值时,其电阻率就会突然减小,甚至消失而无法测量,此现象就是“超导现象”。超导材料就是能够发生超导现象的物质,超导材料在宏观和微观上都展现出许多神奇的电磁特性,主要有完全导电性、抗磁性和约瑟夫森效应。完全导电性:当超导材料处于超导状态时,其电阻值为零,且传输电能可无
期刊
党的十九大提出推动“人工智能”的思想理念。现阶段,随着智能化在生活中得到大范围的普及,智慧农业也逐渐得到重视,我国是农产品生产大国,苹果的生产量居世界第一。但是在生产过程中,防治病虫害的同时,需有效地采取防护措施,即能够保证苹果的产量与质量且减少农药滥用和污染,成为一直以来最看重的问题,其中对苹果叶部病理的智能化检测和识别具有重要的意义。针对苹果叶部病理检测识别中的问题,本文以百度AI公共数据集里
学位
学位
生物质气化是热化学转化中最重要的利用方式之一。在生物质热解气化过程中生物质焦油和生物质灰会带来设备堵塞和结焦结渣等问题,会严重影响设备的安全和稳定运行。而高温和分段气化可以有效控制焦油和灰分的生成,同时利于生物质的转化及反应的精细控制。然而,生物质高温热解气化的一些关键问题并未得到有效的解决:(1)生物质高温热解过程中各热解产物的能和?分布及贡献;(2)生物质高温热解过程中热解温度和热解时间对生物
学位
新能源汽车产业是我国“中国制造2025”确定的重点发展方向和战略性新兴产业。加快培育和发展新能源汽车是我国应对能源和环境挑战、推动传统汽车产业转型升级的紧迫任务。锂电池凭借其优越的特性成为新能源汽车动力电池的首选,荷电状态(State of Charge,SOC)作为表征其剩余电量的指标,是新能源汽车能量管理的重要依据。本课题对锂离子电池SOC的精确估计展开深入研究,主要工作如下所述。首先,以双极
学位
近年来,神经网络已广泛应用于信号处理、机器学习、优化算法、模式识别等领域。在实际应用中,神经网络系统进行数据的运算及传输时,系统中会经常产生时滞。由于时滞的影响,系统的性能会降低,甚至失去稳定,因此,对于时滞神经网络系统的研究具有深远的意义。同时,由于系统中外部噪声的存在,会造成神经网络系统接收信息偏离实际值。为了改善这种情况,可采用状态估计方法以测量输出为基础估计出系统内部不可被测量的信号,或者
学位
矿用带式输送机在煤炭生产过程中起到运输作用,通过输送带源源不断的将煤炭资源从煤矿井下运送到地面供人类生产使用,矿用带式输送机在运行过程中会发生各种故障,因此对矿用带式输送机的状态监控就显得尤为重要。本文在传统矿用带式输送机工业控制系统的基础上研究增加了机器视觉技术,以实现通过视频图像对矿用带式输送机进行异常故障检测、自动调速控制。首先,由于井下带式输送机运行环境中煤粉尘雾以及光照对视频清晰度的影响
学位
随着系统生物学的快速发展,布尔网络作为系统生物学中的一个重要模型,得到研究人员的广泛关注,而考虑控制输入影响的布尔控制网络也成为学者们研究的热点问题。布尔控制网络的状态估计,对状态未知情形下的状态反馈控制器实施至关重要,进一步影响了以布尔网络建模的生物系统演化分析和控制。此外,布尔控制网络的可观性或可重构性,是观测器存在条件。本文主要以布尔控制网络为研究对象,利用矩阵半张量积,研究了布尔控制网络以
学位
综述了采用生物质材质和不同干燥方法与高温热解法相结合获得碳气凝胶的方法;分析讨论了制备工艺、生物质原料对碳气凝胶性能的影响,最后对研究前景和发展方向进行了展望,并提出相关建议。
期刊