【摘 要】
:
随着人工智能和大数据技术的快速发展,网络信息呈爆炸式增长的趋势,在用户可以方便地获取到信息的同时,这些信息的价值性也得不到保证。文本分类任务则为获取有价值的信息提供了基础,如何实现高效的文本分类是一项极具意义的工作。现有的文本分类方法通常使用基于深度学习的方法,但其中仍存在一些问题,不考虑标签信息从而忽略了标签和文本之间的关系,引入过多标签信息也会带给模型过多的噪声。另外地,目前有效的分类放大多需
【基金项目】
:
广东省促进经济高质量发展专项资金项目,《广东省新兴海洋经济产业地图与大数据平台》,项目编号:GDNRC[2020]056;
论文部分内容阅读
随着人工智能和大数据技术的快速发展,网络信息呈爆炸式增长的趋势,在用户可以方便地获取到信息的同时,这些信息的价值性也得不到保证。文本分类任务则为获取有价值的信息提供了基础,如何实现高效的文本分类是一项极具意义的工作。现有的文本分类方法通常使用基于深度学习的方法,但其中仍存在一些问题,不考虑标签信息从而忽略了标签和文本之间的关系,引入过多标签信息也会带给模型过多的噪声。另外地,目前有效的分类放大多需要大量标签数据的支撑,在只有少量样本数据的场景下,会导致分类效果较低。针对上述问题,本文进行了以下工作:针对标签信息对文本的影响问题,本文提出了一种标签感知多头注意力网络模型(LMAN)。LMAN模型通过引入标签注意力和门控机制为文本融入标签信息。具体来说,在文本表示方面,使用Bi-LSTM和多头注意力机制去获取文本的局部特征。然后采用注意力机制去计算标签与文本的相关性,得到每一个标签的基于特定标签的文本表示。同时,考虑到无关的标签会在模型训练时带来噪音,引入关系门控机制对原文本表示和融合标签信息的文本表示进行过滤,得到最终合适的文本表示。最后根据最终的文本表示进行分类。在AAPD和Kan Shan两个数据集上的实验证明LMAN模型可以很好地应用于多标签文本分类任务中,并且分类精确率要优于大多基线模型。针对只有少量样本数据会导致分类效果较低的问题,本文提出了一种融合胶囊网络的小样本文本分类模型(AFCN)。与传统的的文本表示方法不同,AFCN模型采用细粒度的表示方法,使用词嵌入、词性嵌入和字符嵌入来进行文本表示。之后在原有的Bi-GRU网络上引入了双层注意力力,以获取文本中丰富的特征信息。最后利用胶囊网络中的动态路由算法去学习文本到类的映射关系,获得输出胶囊,完成文本分类。在ARSC数据集上的实验证明AFCN模型可以有效地解决小样本分类的问题,相比于其他基线模型,AFCN模型的效果都获得了提升。
其他文献
目前,我国市政工程项目存在一些通病问题,这些问题严重影响了施工质量,尤其是在施工技术方面,许多市政工程都存在类似的问题。若未能及时有效地解决这些存在的通病问题,将会极大地阻碍我国城市的可持续发展,而且由于缺乏先进的施工技术,将导致更多的质量风险,从而危及到居住者的安全。因此,应当高度重视解决我国市政工程施工中的通病问题。
近年来,随着世界各地制造技术的更新迭代,各国关于智能制造概念的陆续提出,制造业向智能制造转型的号角已经吹响。随着技术的发展,异形工件的种类越来越多,且面向异形工件进行基础加工的劳动力逐步减少,诸如打磨、抛光等基础行业对于以机器人加工替代手工加工工件的需求日益增多,针对异形工件生产过程中的机器人技术的研究变得越发重要。当前对于异形工件生产技术的研究已有不少。在工件曲面分片规划方面,学者们侧重于采用不
阻塞性睡眠呼吸暂停低通气综合征(Obstructive Sleep Apnea Hypopnea Syndrome,OSAHS)是人体多系统协同参与的生理活动,各模态生理信号之间存在相关性,相比单模态,多模态数据包含更加丰富的信息,更能揭示模态间的潜在相关性。然而,现有的多模态研究缺乏使用有效的处理手段来发掘各模态之间潜在的相关性,无法适应信号个体差异和通道差异,从而无法兼顾睡眠检测的准确度和稳定
本篇论文主要研究基于近似贝叶斯推断的高效线谱估计算法。线谱估计是指从复正弦信号中分解出频率和复振幅,是信号处理应用中的一个重要基本问题,根据对预设网格(由频率离散值构成)的依赖程度可以把线谱估计算法系统地划分为三类:在网方法(on-grid)、离网方法(off-grid)以及无网方法(grid-less);而近似贝叶斯推断则是指利用先验概率和似然概率推断后验概率的过程,求解得到的后验概率可以用于估
为防止输电线路遭受鸟害而导致发生安全事故,减少电网损失和保障日常生活用电,电网在输电杆塔上投放了大量的驱鸟装置进行驱赶鸟类。针对这类基于实际数据的鸟类驱离策略,由于电网没有对驱鸟装置投放策略进行研究,多数驱鸟装置的投放依赖于一线工人的工作经验,主观性判断会导致驱鸟装置投放成本高以及驱鸟效果不理想;同时随着驱鸟装置技术的日益精湛,电网在未来仍会继续部署新兴技术的驱鸟装置于输电杆塔上,这类待投放的驱鸟
红外图像是一种根据被摄物体表面红外辐射强度分布形成的灰度图像,它具有受环境影响小、夜间成像效果好等优势,具有很大的应用前景。然而,受限于红外成像系统的技术能力和制造水平,现有的红外图像普遍存在的图像分辨率低、对比度低、饱和度不足等问题。本文以深度学习和图像处理技术为基础,研究了基于深度学习的红外图像超分辨率算法,旨在从低分辨率的红外图像中恢复出视觉效果好、分辨率高的红外图像。本文的具体研究内容如下
随着我国经济和科技的快速发展,以家用电器为代表的传统制造业正在积极谋求转型升级,实现生产过程的智能化。基于机器视觉的生产方式能够提高生产效率和降低劳动成本,开始被广泛地应用于家电的生产过程中。在电视机生产的过程中,需要对电视机背板进行喷胶这一操作,一般将背板放置于传送带或者二维平面内,采用单目视觉方式对电视机背板进行定位,实现自动化喷胶。该方法具有结构较为简单,成本较低,易于实现等优点而被广泛应用
在现实生活中,复杂网络系统分布在不同的领域和学科,这其中较为关键的研究方向就是重要节点识别。重要节点识别为复杂网络学科的进一步研究提供了更丰富的角度,其研究内容为利用策略和算法发掘出网络中的重要节点。节点的重要性衡量往往借用图论的基本概念和方法,同时融合多学科如机器学习或贪心策略,可以被广泛地研究。挖掘重要节点在不同的研究领域具有不同的意义,例如在疾病传播网络中控制隔离无症状感染者从而进行有效的防
目的 探讨分析负压封闭引流联合湿润烧伤膏(MEBO)序贯治疗Ⅲ期压疮的临床疗效。方法 选取2019年4月至2021年8月宁乡市人民医院收治的36例Ⅲ期压疮患者作为研究对象,并按照随机数表法将其随机分为观察组(18例)与对照组(18例),观察组患者局部创面采用负压封闭引流联合MEBO序贯治疗,对照组患者局部创面采用负压封闭引流联合凡士林油纱序贯治疗,对比观察两组患者临床疗效、创面新鲜肉芽组织出现时间
机器人在复杂环境中进行动态跳跃有助于提高其跳跃效率,但是受限于地形,单纯利用关节进行跳跃会有很多局限性,例如,无足够的助跑空间,机器人跳跃受限。本研究根据实验室自主研发的飞行仿人机器人Jet-HR2(以下简称Jet-HR2)为原理样机,以电机和涵道风机为混合动力,参照仿生学部分原理,对该机器人的跳跃方法进行了理论设计、分析和仿真实机验证。首先,根据先前研究,总结出机器人的跳跃过程中姿态的控制策略以