【摘 要】
:
语义文本相似度计算在自然语言处理实际应用中有着重要的作用,但由于当前可用的中文语义文本相似度数据集缺乏,因此目前的中文语义文本相似度研究还存在很多局限性。针对这一问题,本文引入EDA和反向翻译方法共计五种数据增强策略对中文语义相似度数据集进行数据增强,并基于ABCNN和ESIM模型进行实验,实验数据显示:五种数据增强策略均有助于模型性能的提升且在数据集数量越少时效果越明显,其中在最小比例的训练集上使用同义词替换数据增强策略达到了3.6%的准确率提升。
论文部分内容阅读
语义文本相似度计算在自然语言处理实际应用中有着重要的作用,但由于当前可用的中文语义文本相似度数据集缺乏,因此目前的中文语义文本相似度研究还存在很多局限性。针对这一问题,本文引入EDA和反向翻译方法共计五种数据增强策略对中文语义相似度数据集进行数据增强,并基于ABCNN和ESIM模型进行实验,实验数据显示:五种数据增强策略均有助于模型性能的提升且在数据集数量越少时效果越明显,其中在最小比例的训练集上使用同义词替换数据增强策略达到了3.6%的准确率提升。
其他文献
本文基于混合式教学模式概念的基础上,探讨了计算机基础教学的改革,探索出一种以教学内容改革为基础、以理论及实践教学方式革新为核心、以师生交互为要点、以课下任务布置与在线指导为延伸的大学计算机基础混合式教学模式,以供参考。
油气管道网络是国家重要的能源基础设施,而与油气管网相关的工控系统在遭受攻击会严重威胁国家安全,针对油气管道等的网络犯罪的不断演变,以及他们所使用的技术、战术和程序也在不断的进步,油气管道的网络安全问题需要进一步的被重视。本文介绍了油气管道网络安全的现状、网络安全防护的必要性以及一种基于服务导向式架构(SOA)的油气管道SCADA系统体系结构,与传统体系结构相比,该体系结构具有更高的安全性。
稀土精矿冶炼炉窑是稀土生产工艺的核心装备,会产生大量含氟酸性高温烟气,其中氟化物0.81%、硫酸雾1.06%、二氧化硫0.23%,同时温度达300℃以上,烟气余热丰富,烟气成分的复杂性和特殊性为余热及资源回收利用带来挑战。介绍一种新的稀土精矿冶炼炉窑的高温烟气余热利用技术及其现场中试情况。根据物质流、能量流守恒计算了烟气流量、温度、组分浓度以及余热量,分析了余热回收的可行性和技术难点;提出了新的烟气干法余热回收工艺,依据能源梯级利用原则,通过余热锅炉实现烟气分级降温和余热回收,同时回收高浓度冷凝酸并副产余
本文设计了一款基于BF7615单片机的性价比高、可靠性高、可远程监控的火灾报警监测系统。该系统主要由主控芯片模块、温度感应模块、烟雾浓度感应模块、显示模块、按键模块、报警模块和WI-FI模块组成。通过烟雾传感器检测烟雾,热敏电阻感知温度,通过WI-FI模块发送数据到APP,发生火灾后报警电路报警。画出了软件流程图,最后对系统进行了测试。
传统推荐系统中存在用户评分数据高维稀疏、分布不均匀和传统用户相似度计算准确性低等问题,本文提出一种基于改进局部敏感哈希的协同过滤算法。首先利用改进局部敏感哈希算法对用户评分数据进行降维处理并构建索引,并使用相似度修正系数对用户相似度计算做出改进;然后利用索引敏捷切确地计算目标对象的近邻用户集合;之后选择近邻用户聚集的高相似度用户,使用加权算法对目标对象未评分项目进行评定预估。实验结果表明,对于非均匀用户评分数据的高维稀疏问题,该算法不仅能明显缩短近邻用户检索时间,且能有效提高推荐精度。
数值模拟了微通道受限空间内气体-近壁颗粒流动与传热过程,所建模型考虑微尺度气体的可压缩与变物性特征,且在通道和颗粒壁面采用速度滑移和温度跳跃边界条件以考虑滑移区气体动量/能量非连续效应。在此基础上,计算分析了克努森数(Kn)和颗粒偏移比对颗粒表面拖曳力系数(CD)以及传热努塞尔数(Nu)的影响规律。研究结果表明:受气体稀薄效应影响,颗粒表面拖曳力系数呈减小趋势,换热过程也相应削弱;随颗粒与壁面距离减小,颗粒表面拖曳力系数相应减小,而颗粒与其
合理地利用PLC完成锅炉控制系统的控制工作,能够大大提升锅炉的燃烧效率,减少污染气体的排放,对供热锅炉的安全高效运行有明显的促进作用。基于此,本文探讨了PLC系统硬件构成和软件设计,分析了PLC的应用技术特征,研究了PLC在锅炉控制系统中的应用注意事项和应用要点。
人工智能作为当今世界上最重要的科技之一,已融入人们生产生活的各个方面。人工智能产业繁荣发展离不开数据的驱动、算法的创新、算力的提升与场景的融合。大数据、算法、计算能力、场景与产品化之间正在形成一种共生生态,大数据为人工智能提供源源不断的动力,人工智能衍生出了诸如深度学习、强化学习、迁移学习、对抗学习(GAN)等新型算法,硬件计算能力提升有效地缩减了算法迭代改进周期。本文介绍了AI技术落地算法研发基本流程,研究了AI技术的应用,以供参考。
针对高倍聚光比下太阳能电池的热致失效问题,设计了一种带有回流结构的矩阵式微射流热沉。建立了热沉的三维物理和数学模型。并采用计算流体力学(CFD)软件对其进行了数值模拟,研究了回流通道数目、回流孔分布位置、射流高径比等因素对微射流热沉传热和流动特性及热有效性的影响。结果表明:在稳态条件下,回流孔数为49个结构的热沉性能比回流孔数为25个的热沉换热性能要好;当回流孔数目不变时,射流高径比(H/d)越小的热沉换热性能较好;被冷却表面平均温度随气体射流雷诺数增大而降低;系统压损随着射流雷诺数的增大不断增大;射流雷
近几年,信息技术的发展比较快速,逐渐应用到各个领域中.在信息技术广泛的应用的背景下,安全成为了计算机的重点.在网络上中对计算机的攻击手段多种多样,为了保证计算机中信息