【摘 要】
:
句子分类是自然语言处理(Natural Language Process,NLP)领域一个基本且重要的任务,广泛应用于NLP的很多子领域,例如情感分析、问题分类、口语对话等等。该任务的目标是为输入句子分配一个预定义的标签。解决句子分类问题的核心关键是通过提取位于不同位置的关键词或者短语来理解句子语义。虽然当前许多基于深度神经网络的方法在句子分类任务上取得了出色的性能,但是仍存在以下问题:基于卷积神
论文部分内容阅读
句子分类是自然语言处理(Natural Language Process,NLP)领域一个基本且重要的任务,广泛应用于NLP的很多子领域,例如情感分析、问题分类、口语对话等等。该任务的目标是为输入句子分配一个预定义的标签。解决句子分类问题的核心关键是通过提取位于不同位置的关键词或者短语来理解句子语义。虽然当前许多基于深度神经网络的方法在句子分类任务上取得了出色的性能,但是仍存在以下问题:基于卷积神经网络(Convolutional Neural Networks,CNNs)的方法难以建模句子的非连续依赖和顺序信息,而基于循环神经网络(Recurrent Neural Networks,RNNs)的方法容易忽略局部特征,为此一些方法将两者以堆叠多层或者结合注意力机制的方式相结合,通过提升模型复杂度来提升模型的分类效果。然而这种方式容易导致网络的特征冗余或过拟合,尤其是在有监督样本比较少时。因此,如何有效地融合多种网络的特征,提升模型的泛化能力并充分对句子的多尺度特征建模,仍然是具有挑战性的问题。本文探索一种新型的多尺度循环神经网络——多尺度正交独立长短期记忆网络(Multiscale Orthogonal Independent LSTM,MODE-LSTM),吸收了CNN局部特征建模和RNN非连续依赖建模的特性,并且具有少量的参数,能够建模句子多尺度特征等特点,在模型能力和复杂度上取得较好的平衡。首先设计一种正交独立长短期记忆网络(Orthogonal Independent LSTM,ODE-LSTM),将隐藏状态解耦成多个独立更新的小隐藏状态减少模型复杂度,提升模型泛化性能,并利用一个正交约束惩罚损失提升特征的多样性。随后,引入一种滑动窗口机制限制ODE-LSTM的循环执行过程,使其每一时间步的隐藏状态计算仅依赖于局部窗口的单词,在保留循环网络非连续依赖建模能力的同时,提取句子的局部短语特征。最后,进一步地采用多种不同尺度滑动窗口并行操作建模句子的多尺度特征。在八个句子分类数据集上进行实验并取得了良好的结果,通过结合预训练上下文表示能够进一步提升模型的分类准确度。此外,还通过大量的实验分析验证了模型的泛化性以及多尺度表示的有效性。
其他文献
氮、磷是导致水体富营养化的重要因素,也是大多数城市污水处理厂需要解决的难题。随着水体富营养化问题的加剧,我国生态环境保护法规不断的完善,全国各污水处理厂的排放标准也逐渐从《城镇污水处理厂污染物排放标》(GBl8918-2002)一级B标准升级到一级A标准,对污水处理厂在工艺的选择和运行管理上都提出了更高的要求,因此大多数的城市污水处理厂都面临提标改造的问题。本文以目前城市污水处理中热点关注的脱氮除
随着物联网(IoT)和5G通信的不断发展,现实中许多应用场景对信息都具有高度的时间敏感性,而信息年龄(Age-of-Information)作为一种新的性能度量指标应运而生。信息年龄在物联网中可以用来度量用户终端所生成信息的新鲜性或者时效性。大多数现有的信息更新机制研究主要考虑来自单个源节点或具有独立观察性质的多个源节点的信息更新。然而在一个现实的物联网系统中,每一个信息都应该可以被其他多个源节点
高分辨率遥感图像的目标检测是一项具有挑战性的任务。尽管有许多基于卷积神经网络(Convolutional Neural Network,CNN)的先进方法在自然图像中取得了不错的效果,遥感图像中的目标检测进展得却不是那么顺利。不同于自然图像,遥感图像中的目标具有任意方向、密集分布和尺度差异大的特点,导致会出现一系列如特征不对齐、误检漏检和大长宽比目标检测不佳的问题。针对上述问题做出的相应改进工作如
不同于其他学科,建筑类学科教育与其载体——建筑系馆的联系十分紧密,是高校中的特殊教学空间。建筑系馆作为建筑类学生学习的第一站,其重要性不言而喻。空间的质量对开展教学工作、学生自主学习探索、合作交流等环节都有着直接的影响。随着建筑类学科及其教育的发展,师生们对建筑系馆空间的需求也相应地产生了一系列变化,集成化与共享化的趋势在历代建筑系馆空间演化特征中越来越凸显。目前许多建筑系馆已无法容纳不断增多的学
核酸被广泛地应用于各个领域,但是,与具有多种侧链的氨基酸相比,核酸的组成单元简单,功能有限。同时,核酸稳定性较差,在体内容易被酶或其他内源性物质降解,这限制了其应用,引入非天然核酸能有效地解决这一问题。非天然核酸是在核酸的磷酸、糖基或碱基上进行化学修饰或改造而获得,这些修饰基团丰富了核酸在结构和功能上的多样性,因此非天然核酸在检测试剂和生物材料等领域具有重要的价值。随着定向进化技术的发展,一系列能
顶底角钢连接的半刚性节点因其良好的变形能力和耗能能力引起了人们的普遍关注,成为了国内外学者重点研究的热点。顶底角钢连接节点初始刚度和承载能力偏小的缺点,限制了其应用,因此,本文在顶底角钢连接节点的基础上,设计了在角钢加劲肋上焊接约束肋的加强型节点形式,同时也利用高强钢屈服强度高的特点,设计了将普通钢加劲肋换成高强钢加劲肋的加强型节点形式,相比较于普通带加劲肋顶底角钢螺栓连接梁柱节点,这两种加强型顶
图像超分辨率重建问题是计算机视觉领域中关键的技术领域之一。随着硬件技术与算法研究的不断深入和发展,超分辨率技术开始从图像处理逐渐渗透至通信、医疗、文化传播、休闲娱乐等多个领域,具有广阔的应用前景与巨大的商业价值。虽然图像超分辨率重建领域的研究随着深度学习技术的发展而不断取得重建精度上的突破,但算法计算量过高、高层特征提取效率低、生成对抗网络训练困难的问题仍有待解决。因此,以深度学习为基础,本文将围
储能系统中,往往需要大量储能元件串并联来满足负载的电压和功率需求。但受限于制造工艺的影响,储能元件间的特性都会存在差异,从而导致储能元件单体电压在使用过程中产生不一致现象,降低整个储能系统的能量利用率和储能元件的使用寿命,因此需要引入电压均衡技术。但是,目前常见的储能系统往往将能量储存电路和均衡电路分开设计,不得不引入大量额外的均衡器件,增加了系统的体积和成本。因此,本课题基于开关电容原理,通过复
在异形插件机的视觉系统中,考虑电子元件趋于多样化、精细化以及PCB集成度越来越高,这对插件机等元件组装设备的精度要求不断提升。针对插件机视觉系统要求精度高、实时性高、系统结构空间狭小的特点以及目前在精度分析方面旋转视觉针脚位姿测量理论尚不完善的问题,为满足越来越精密化、快速化的要求,本文基于旋转立体视觉系统提出针脚位姿的两种重构方法,并根据搭建的数学模型对主要系统参数与结构参数进行误差分析,以解决
我国传统规划在目标传导和实施管理过程中往往不能实现其初衷,随着《关于建立国土空间规划体系并监督实施的若干意见》等中央文件的相继发布,各地逐步开展国土空间规划的探索实践。然而在“五级三类”的国土空间规划体系下,总体规划如何构建目标体系,总体规划与详细规划之间如何进行目标传导,如何保证目标的实现——即如何管控实施等问题尚在探索中。澳大利亚联邦的昆士兰州首府布里斯班,其市议会编制的《布里斯班城市规划20