【摘 要】
:
目前,基于机器学习的情感分类研究虽然在高资源语言的研究中取得了不错的发展,但是对于一些小语种(例如孟加拉语)这样的语言仍然处于起步阶段.研究小语种的情感分类关键在于语言处理模型和语料库的选取.本项研究提出了一种基于Transformer的情感分类技术,可以将小语种文本分为6种基本情感:愤怒、恐惧、厌恶、悲伤、快乐和惊讶.为了完成本项分类任务,准备了6000个小语种文本组成的语料库,然后利用各种机器学习模型(例如SVM、MNB、LR、RF)、深度神经网络模型(例如CNN,BiLSTM,CNN+BiLSTM)
【机 构】
:
广东白云学院,广东广州510450
论文部分内容阅读
目前,基于机器学习的情感分类研究虽然在高资源语言的研究中取得了不错的发展,但是对于一些小语种(例如孟加拉语)这样的语言仍然处于起步阶段.研究小语种的情感分类关键在于语言处理模型和语料库的选取.本项研究提出了一种基于Transformer的情感分类技术,可以将小语种文本分为6种基本情感:愤怒、恐惧、厌恶、悲伤、快乐和惊讶.为了完成本项分类任务,准备了6000个小语种文本组成的语料库,然后利用各种机器学习模型(例如SVM、MNB、LR、RF)、深度神经网络模型(例如CNN,BiLSTM,CNN+BiLSTM)和基于Transformer模型(例如Bangla-BERT,m-BERT,XLM-R)的方法进行训练,结果证明基于Transformer的方法要优于其他模型.
其他文献
音频伪装技术是信息隐藏技术领域的一个重要分支,在数字水印和隐蔽通信等方面有着广泛应用.作为一种寄生通信技术,音频伪装的应用需满足两个条件:一是要有能够携带隐藏信息的音频载体;二是音频载体要有冗余,能够容纳额外的隐藏信息而不显著降低自身的通信性能.文章在描述空气信道模型、干扰因素,人耳听觉系统的基础上,提出了一种面向空气信道的音频伪装模型.实验表明,文章提出的模型具有很好的鲁棒性.
对当前高校图书盘点现状和方法选择进行阐述和分析.进一步阐述盘点工作的过程,通过ACCESS数据库处理盘点数据及馆藏数据,然后利用结构化查询语言(SQL)对进行盘点数据与馆藏数据对比,从而找出异常数据,实现馆藏数据与实物图书相符.
城市化进程的不断加快使得城市规模越来越大,越来越多的城市大力发展城市轨道交通.城市轨道交通通信网络规划在城市轨道交通的安全、可靠、高效运营中发挥着至关重要的作用,是城市轨道交通正常化运行的保障.文章对城市轨道交通通信网络规划进行研究,指出在城市轨道交通通信网络规划的过程中必须坚持先进性、可靠性、实用性、开放性的原则,并对公务电话系统、专用电话系统、视频监控系统、无线指挥系统进行组网架构.本论文的研究对提升城市轨道交通的运营管理水平,促进城市的智能化发展具有一定的参考价值.
通过研究BSM期权定价模型理论,并以腾讯股票为例进行期权价格、盈亏、股价对该期权价格影响进行全面分析.首先通过开源的财经接口Tushare获取股票原始数据,接着利用Pandas、Numpy、Matplotlib来进行股票数据的处理、计算分析、数据可视化处理,最后通过分析得出对股票期权投资有价值的结论.它可以广泛应用于其他股票期权投资的分析,对客户做好期权投资具有一定的参考价值.
电力系统信息安全对日常办公与电力调动有着直接影响,严重时可能出现系统全面瘫痪、信息泄露等问题.文章对电力信息安全面临的问题进行分析,并结合实际案例,构建了安全基线标准体系,从提出背景、体系构建、保障措施等方面,论述了创建信息安全基线标准体系的方法与效果.最后提出电力信息系统安全基线的测试方法,包括安全防护体系测试、物理安全测试、系统安全测试三个方面,形成一套成熟完善的安全防范系统,使企业信息安全得到切实保障.
多合一智慧能源站中的数据中心承担着为电力物联网提供各类资源的责任,还肩负开展商业化运营、实现盈利多元化的使命.通过数据中心的感知建设,从环境、能量、物、人、容量等多个方向进行逐项分析,将感知数据合理关联、协同融合,丰富感知的层面和维度,形成共享共治的感知体系,精确监测数据中心的机体健康,把控数据中心在全寿命周期内的运行、运维和运营指标,为数据中心提供高智能、高灵敏、高融合的免疫及自愈服务.
文章通过介绍基于hadoop平台下数据治理系统在高校数据治理中的意义和价值,就高校数据治理的现状如何进行数据治理、如何建立数据治理的体系架构进行阐述,并围绕着基于hadoop数据治理技术平台的建设,数据标准的制定,如何支撑业务系统的场景及应用进行介绍;最后对开展hadoop平台的数据治理意义进行总结.
互联网时代网络信息安全至关重要,网络安全关系到网民的个人信息和财产安全,甚至关系到网民的人身安全,因此要加强计算机网络信息安全技术的研究,确保计算机网络安全,维护网络环境与秩序.目前计算机网络信息安全常用的技术是虚拟专用网络技术,它不仅能够保证计算机网络信息安全,还可以提高企业员工的工作效率,降低企业运营成本,提高企业经济效益,因此需要普及虚拟专用网络技术来维护计算机网络信息安全.文章以虚拟专用网络技术为研究对象,分析了该技术的种类以及在各种场景中的应用,让更多人认识和了解虚拟专用网络技术,促进其发展.
为满足“三集五大”信息通信支撑体系和智能电网建设要求,信息通信一体化运维模式建设近年来受到业界高度关注.基于此,文章简单介绍供电企业信息通信一体化运维思路,并深入探讨供电企业信息通信一体化运维模式的具体应用,具体涉及管理体系建设、网络控制室建设、运维体系建设、保障措施四方面内容,以供业内人士参考.
文章重点探讨了在网络安全领域基于事件的威胁识别应用研究与AI解决思路.首先介绍了目前网络威胁识别的主要手段存在的不足,提出了单事件异常检测与多事件异常检测相结合的检测模式,同时探讨了人工智能在两种检测模式上的主要应用思路.该检测模式与人工智能相关技术的糅合应用,最终形成一种基于大数据和环境的,动态的整体的网络威胁识别、风险感知与预警的能力解决方案.该解决方案有助于政府机关、各大企业、各类重要机构在日常网络安全运维和各类专项保障活动中提升防护效率,帮助安全运维人员快速预警、处置高危事件.