【摘 要】
:
微博是中国互联网最活跃的社交平台之一。对微博评论进行情感分类,对舆论控制、商业决策和反恐领域都具有重大意义。目前针对微博评论情感分类研究具有较多难点,存在文本口语化严重、同音错别字高频出现及新型网络语言层出不穷等问题,而因传统词向量缺乏对情感信息表征而导致的模型难以准确学习到文本情感信息的问题也亟待需要解决。 针对目前情感词典主要基于规范语言而忽略了网络语言等不规范语言的现象,统计整理出了常见网
论文部分内容阅读
微博是中国互联网最活跃的社交平台之一。对微博评论进行情感分类,对舆论控制、商业决策和反恐领域都具有重大意义。目前针对微博评论情感分类研究具有较多难点,存在文本口语化严重、同音错别字高频出现及新型网络语言层出不穷等问题,而因传统词向量缺乏对情感信息表征而导致的模型难以准确学习到文本情感信息的问题也亟待需要解决。
针对目前情感词典主要基于规范语言而忽略了网络语言等不规范语言的现象,统计整理出了常见网络语言列表,并利用开源的情感词典以及微博评论文本,构建网络语言情感词典,提高网络语言分词准确率的同时,充分利用其中包含的情感信息。
针对传统词向量对情感信息缺失的现象,借鉴心理学的普鲁契克情绪轮盘理论构建情感向量,提出了一种多情感词向量调整算法。该算法通过情感向量从多情感角度调整预训练好的词向量,在增强情感表征的同时避免语义信息的损失。实验证明,情感增强后的词向量能有效提升多个模型情感分类性能。
针对微博文本特点以及现有模型特征提取相对单一的问题,利用卷积神经网络和循环神经网络的特性在词语、词性以及拼音三个层次进行特征提取,构建了多通道Bi-LSTM-CNN(Bi-directional Long Short Term Memory-Convolutional Neural Networks)联合情感多分类模型,并在注意力机制中引入词性以及情感向量,构建了word-POS-senti(word-Part-Of-Speech-sentiment)注意力机制。实验证明,该分类模型相比其他模型具有更好的综合性能,同时word-POS-senti注意力机制能有效提升模型的收敛速度和分类性能。
其他文献
近年来,氮、磷等污染物超标排放已经产生了许多严重的影响。即便我国加大了对水污染的管控力度,但污染问题依然严重。根据我国国情,开发一种能耗低,效率高的新型污水处理工艺具意义重大。因为传统的生物脱氮工艺流程长、投资成本高,现今国内外研究人员陆续开发了多种新型脱氮工艺,其中同步硝化反硝化(Simultaneous Nitrification and Denitrification,SND)具有投加碳源少
针对部分企业危险工业废水集中处理费用高的问题,本文研究了减量化处理危险工业废水的技术。此技术采用真空蒸发的方法提取危险工业废水中的大部分纯水,产出浓缩液。其中真空蒸发的方法利用了双程相变换热器进行换热,废水在真空泵形成的低温低压环境下蒸发,其所需的热量由真空泵产生的过热蒸汽在高温高压环境下冷凝释放的热量提供。因此水蒸汽的汽化潜热得以回收重复利用,也就是说这部分能量不需要外界提供,而真空泵消耗的能量
由于微型机电系统(MEMS)具有微型化、可批量生产、集成化程度高、易于扩展、多学科交叉的特点,近几年来得到了迅速的发展。而微型机电系统内的微流体驱动控制引擎——微泵是制约和推动微流体设备发展的关键,是国内外微流体设备研究的重点领域之一。Knudsen泵凭借着其无运动部件、结构简单、易于批量制造、易于扩展、能量来源广泛、低能耗等优点,受到了国内外众多学者们的关注,对其的研究和相关理论也日臻完善。前人
随着组织工程的迅速发展,能够模拟人体微环境的三维细胞培养技术应运而生,逐渐显示出比传统二维细胞培养方式更加全面的优势。将三维细胞培养技术应用到肿瘤研究中,可探索肿瘤侵袭机制、肿瘤微环境、肿瘤药物筛选等系列领域,有效解决了二维培养实验结果准确性低的问题。微流控芯片技术凭借微尺度、高效率等众多优势,在细胞研究中应用广泛,通过设置合理的培养结构,可以实现一种或多种细胞的芯片在线长期培养,为生命科学领域的
真空蝶阀具有洁净无油、体积小、不受介质流向影响等优点,被广泛应用于半导体制造、生物制药等需求清洁真空的行业。在实际工况下,真空蝶阀可能会面临复杂苛刻的抽气环境,如含粉尘颗粒气体、吸入压力或温度的变化等。因此研究真空蝶阀内流体的流动特性和蝶阀的热场分布与热变形具有重要意义。 本文主要利用计算流体力学(CFD)方法、数值传热学方法及有限元分析方法(FEM)对真空蝶阀展开研究。根据蝶阀结构,建立其内部
钛酸锌(ZnTiO3)材料具有优异的微波介电性能,已经在移动通讯设备中的片式介质谐振器,气体传感器,颜料和薄膜太阳能电池等器件方面得到了应用。同时,钛酸锌又是宽禁带半导体材料,对其进行磁性元素的掺杂可能使其成为新的稀磁半导体材料。现有对钛酸锌的研究大多聚焦于其纳米,粉体和块体材料,且纯相钛酸锌难以获得,所以其在光学和电磁方面的报道比较匮乏。另外,改变材料的化学计量比或者进行元素掺杂将会改变材料的物
视频监控平台互联作为安防领域的重要研究课题,对平安城市的有效推进有着重大的应用价值。随着公民安全保护意识的逐渐提高,人们对公共财产安全的防护需求也越来越高,作为安防领域的关键技术之一,视频监控的覆盏范围也就成为了维护公共财产安全的重要因素,如果能将视频监控系统统一连接起来,则会更加快速直观的提升安全防护的范围。而现有的视频监控系统在实现方式方面并不统一。基于实时流传输协议(Real TimeStr
六足机器人在危险或灾难环境中运动时,腿部容易发生故障并且无法及时进行人工修复。如果故障机器人可以根据当前情况找到能够让其继续运动的步态,则认为机器人在当前故障情况下可以进行容错运动,这样会提高六足机器人在未知环境中的适用性。本文对六足机器人在运动过程中,支撑腿发生单腿失效时的稳定性进行分析,并根据当前情况利用余下正常腿生成新的步态。具体内容有以下四个部分: 1、当六足机器人处于三角步态运动时,对
数据备份是当今企业实行数据保护和存储管理的主要途径,然而数据备份系统中存在大量的冗余数据。重复数据删除技术现已广泛应用于数据备份系统来识别和消除冗余数据,从而加速系统中的备份流程并减少存储开销。为了保证数据流的空间局部性,重复数据删除将多个数据块组织到固定大小的容器中,作为系统中的存储单元。备份流中的小文件生成的小数据块产生大量元数据导致容器的数据区域无法被填满,这会降低存储空间效率并加剧恢复性能
深度神经网络的发展使得人脸识别技术取得显著进展,但是深度学习模型容易受到对抗样本的攻击。对抗样本是指故意添加细微的扰动所形成的输入样本,它会使模型判断错误。人脸识别模型同样易受对抗样本攻击,研究人脸识别模型在对抗攻击下的脆弱性有助于人们更好的了解对抗样本,从而获得鲁棒性高的模型。本文在黑盒场景下,研究人脸识别对抗攻击算法。 针对黑盒攻击成功率低的问题,提出了基于Dropout的梯度符号法。该算法