【摘 要】
:
随着近年来信息技术的飞速发展,海量包含各类观点与情感的文本分布于各个社交平台,对这类文本进行情感分析研究显得极为重要。在不同语言中,藏文情感分析研究相较于汉文、英文仍处于初步发展阶段。藏文情感分析相关研究成果较少,研究者采用的研究方法相对滞后,因此推动藏文情感分析研究的发展刻不容缓。藏文情感分析研究由于缺乏公开且被广泛认可的数据集受到很大限制,并且目前藏文情感分析研究方法大多基于机器学习和较为单一
论文部分内容阅读
随着近年来信息技术的飞速发展,海量包含各类观点与情感的文本分布于各个社交平台,对这类文本进行情感分析研究显得极为重要。在不同语言中,藏文情感分析研究相较于汉文、英文仍处于初步发展阶段。藏文情感分析相关研究成果较少,研究者采用的研究方法相对滞后,因此推动藏文情感分析研究的发展刻不容缓。藏文情感分析研究由于缺乏公开且被广泛认可的数据集受到很大限制,并且目前藏文情感分析研究方法大多基于机器学习和较为单一的深度学习模型,因此本文针对这部分问题进行了相关研究。本文借鉴了汉、英文情感分析研究的相关成果,利用目前自然语言处理领域中如火如荼的深度学习方法对藏文情感分析进行研究。本文针对基于深度学习方法的藏文情感分析研究开展了四个方面的主要工作,具体如下:1.针对目前藏文情感分析领域缺乏公开数据集的问题,构建了一个藏文情感分析数据集并已公开在Github平台供相关研究者使用。构建藏文情感分析数据集的方式是从两个公开的中文情感分析数据集weibo_senti_100k和Chn Senti Corp中摘选出包含两类情感极性的10000条句子,然后由团队相关专业的成员采用成熟的汉藏机器翻译工具结合人工对原数据集进行翻译和校对,最后构建完成一个用于情感分析的藏文数据集。2.针对藏文情感分析方法多基于单一的深度学习模型,各个模型存在着不同的优缺点,因此本文提出了一种基于混合神经网络模型——AL-TCBAT应用于藏文情感分析。该模型利用ALBERT预训练模型生成词向量,在同方向上首先通过Text CNN模型对藏文文本序列特征进行局部提取,获得相对重要的文本信息,然后通过双向Bi LSTM层对经过Text CNN模型的提取特征再次进行特征构建,提取其中更深层次的信息,最后融入注意力机制,使得网络更加关注众多特征中权重较大的部分。实验结果表明,该模型可以提高分类模型的准确率。3.针对单一通道混合神经网络会随着网络层数的增加造成特征较为严重丢失等问题,本文提出了一个多通道混合神经网络模型——AL-DCBAT。首先通过ALBERT预训练模型生成的词向量分别输入到Text CNN以及Bi GRU网络中进行特征提取,为进一步提高Bi GRU部分对关键情感特征的提取能力,在Bi GRU模型后引入Attention机制,其次将两部分的output进行融合后输入至归一化层得到最终的情感分类。实验结果证明,该模型可以在减少横向网络深度的基础上提高模型的分类准确率。4.针对传统深度学习模型对序列文本特征提取能力有限以及普遍采用增加模型深度以提高最终分类效果的问题,本文提出了基于图神经网络方法的ALSGraph SAGE模型应用于藏文情感分析。首先,模型通过ALBERT预训练模型进行训练,得到初步句子特征向量。其次,为进一步提高特征向量的质量,提出融合情感词特征的方法,将数据集中的每条藏文句子进行情感词提取并且通过Embedding随机初始化其特征,之后将初步句子特征与情感词特征进行融合作为最终句子特征。然后,在图构建方面将藏文句子与标签构建为文本-标签图,完成图数据的构建。最后将图数据输入Graph SAGE图神经网络模型进行特征学习并且得到最终情感分析的结果。实验证明,本文提出的ALSGraph SAGE模型取得了较好的类准确率。
其他文献
<正>化疗,即化学药物治疗,是许多恶性肿瘤的主要治疗手段之一。化疗药物外渗是化疗常见并发症之一,是指化疗药物输注过程中渗出到外周组织中,导致局部皮肤红、肿、热、痛,如若处理不当可引起局部组织坏死。以下为常见化疗药物分类及化疗药物外渗后处理方法。
基于1998—2019年我国粮食主产区13个省份的数据,测算了粮食主产区的农业碳排放,并进行了动态演进分析、LMDI因素分解和公平性评价,研究发现:(1)从核密度动态演变来看,粮食主产区的农业碳排放总量呈现较大幅度提高,但省际之间的差距逐渐缩小。(2)从LMDI因素分解来看,经济因素为农业碳排放的增加因素,而效率因素和劳动力因素可以减少农业碳排放。(3)从农业碳排放的公平性来看,我国粮食主产区的种
在经济社会低碳转型变革中,农业作为三大支柱产业之一,其碳排放效率是判断农业可持续发展的重要指标。本研究采用考虑非期望产出的全局SBM模型测算东北三省36个城市在2010—2019年的农业碳排放效率,并运用空间聚类分析和地理探测器探究其空间分异特征及驱动因素,旨在为推动东北地区实现农业高质量发展提供启示。研究结果显示:(1)2010—2019年东北三省农业净碳汇总量和农业碳排放效率整体呈上升趋势,从
受电弓滑板是列车的重要组成部分,其可靠的性能对列车的运行安全具有重要影响。文中分析了受电弓滑板的服役性能要求以及检测现状,系统对比了国内外受电弓滑板的检测技术方法。研究发现,国内外受电弓滑板的检测项目可分为力学性能、电学和温度性能、摩擦磨损性能、自动降弓性能、碳条性能等5大类19小项,IEC 62499-2008、EN 50405-2015与国内的受电弓滑板的检测标准存在一定的关联性,而磨耗性能、
为研究受电弓滑板摩擦磨损性能的影响因素,根据磨耗演变规律对磨耗进行预测,采用置信区间估计法,确定滑板历史磨耗数据统计值上下界和基准训练集,建立机器学习的线性回归模型,以梯度下降法使代价函数趋于最小对模型进行优化。通过对该模型及方法的应用,预测滑板剩余厚度限集,并通过与某型车实测磨耗数据比较。结果表明:预测数据与实测基本一致,可为有效减少动车段对受电弓滑板维护工作量提供依据。
以国内某地铁线路在冬季运行中出现异常磨耗的受电弓浸铜碳滑板为研究对象,借助多种微观测试手段,比较其表面形貌、微观组织、化学成分等与正常磨耗状态的碳滑板表面的差异,探究碳滑板出现异常磨耗的原因及机制。结果表明:与正常磨耗状态碳滑板相比,异常磨耗状态下碳滑板表面三维形貌崎岖且粗糙,其接触条件显著恶化,机械磨损、磨粒磨损、电弧烧蚀、材料转移等形式的磨损量均有增加;在进入秋冬季节后,碳滑板表面润滑条件发生
光在调节大多数动物的行为和生理方面起着核心作用,可产生视觉及非视觉效应。视觉效应是动物获取外界信息的重要方式,外界变化的信息通过视网膜的感光成像作用经由视觉传导通路最终传导到视皮层,获取物体的空间和颜色特征。非视觉效应主要表现为参与瞳孔对光反应、调节睡眠或活动时的神经内分泌以及调控昼夜节律,使机体的生理和行为与外界光环境保持协调。本文针对光的非视觉效应在感光细胞和相关投射脑区间的信息传递进行综述。
<正>光敏感与光敏性癫痫,这类患者相对比较少,可用脑电图检查行闪光诱发区别、确诊。多种视觉性刺激可引起视觉反射性癫痫发作,如:闪耀的阳光、闪光灯、电视图像、电子游戏画面、迪斯科舞厅灯光、闪烁的日光灯以及自动扶梯的移动等,这就是光敏性癫痫。光刺激主要引起患者小发作和肌阵挛。
目的 研究丙戊酸钠联合齐拉西酮对双相情感障碍Ⅰ型患者临床效果和认知功能的影响。方法 选择2018年8月—2020年8月茂名市第三人民医院收治的双相情感障碍Ⅰ型患者为研究对象,共86例,采用随机数字表法将其分成对照组与观察组,每组43例。对照组采用丙戊酸钠治疗,观察组采用丙戊酸钠联合齐拉西酮治疗,对比2组患者治疗前后认知功能[韦克斯勒成人智力量表(WAIS-RC)、韦克斯勒记忆量表(WMS)评分]、