【摘 要】
:
针对中文文本纠错领域中训练深度学习模型所需要的标注数据有限这一问题,提出了五种数据噪声替换方案.通过实验验证,证明了其中的音似替换和形似替换两种方案可以有效增强该领域数据质量,然后通过对这两种替换方案的对比实验,探索出了一种更有效的混合替换方案.其核心在于通过噪声替换的方式提升现有数据集的大小和多样性,进而提高中文拼写纠错模型的性能.
【机 构】
:
北华航天工业学院计算机学院,河北廊坊065000;北华航天工业学院计算机学院,河北廊坊065000;拓尔思信息技术股份有限公司,北京100000
论文部分内容阅读
针对中文文本纠错领域中训练深度学习模型所需要的标注数据有限这一问题,提出了五种数据噪声替换方案.通过实验验证,证明了其中的音似替换和形似替换两种方案可以有效增强该领域数据质量,然后通过对这两种替换方案的对比实验,探索出了一种更有效的混合替换方案.其核心在于通过噪声替换的方式提升现有数据集的大小和多样性,进而提高中文拼写纠错模型的性能.
其他文献
气体绝缘输电设备内微粒污染物是造成设备故障的主要原因之一,随着设备电压等级的升高,微粒诱发的绝缘故障占设备总故障的比例越来越大,探索高效的微粒抑制措施,对降低设备故障率、保障设备安全稳定运行具有重要意义.文中对交直流GIS/GIL中微粒污染治理措施研究进展进行梳理,首先概述了气体绝缘设备中抑制微粒的基本原理,从微粒启举抑制、微粒运动调控和绝缘子表面微粒吸附抑制3方面阐述了如何降低微粒对设备绝缘的潜在威胁;进一步归纳总结了现有的微粒治理方法,对其优势和不足进行了评价,提出了该领域有待解决的关键问题,以期为管
气体绝缘组合电器(gas insulated switchgear,GIS)和气体绝缘金属封闭输电线路(gas insulated metal-enclosed transmission line,GIL)运行电流大,设备内部存在明显的温度梯度分布,造成高压电极附近电荷的注入与迁移加剧,导致绝缘子内空间及表面电荷的积聚,畸变电场,容易诱发沿面闪络故障.为此文中建立了电—热耦合应力下直流盆式绝缘子内的电荷注入与积聚模型,研究了考虑电荷注入和迁移特性的绝缘子空间电荷及表面电荷积聚情况,并分析了不同负载电流下绝
通过水压试验和仿真分析,研究了252 kV三相共箱盆式绝缘子的机械特性,得到了三相共箱盆式绝缘子的应力分布及薄弱位置.在水压试验中实时测量了盆式绝缘子的应变,得到了绝缘子的应力分布和变化;对绝缘子水压过程进行了仿真分析,仿真结果与试验结果一致.研究结果表明:三相共箱盆式绝缘子破坏压力值为2.6 MPa,对应的最大破坏应力为78.28 MPa;水压破坏呈胞性破坏;绝缘子的薄弱位置是孤面曲率变化最大处.
GIS触头温度是反应触头热故障信息最直接的指标,有必要实时监测其温度.目前无法在触头上安装传感器来监测其温度,因此文中提出利用多点外壳温度和环境温度的监测值来反演计算GIS触头温度,并对布置在外壳上的多点传感器进行了优化.首先建立了500 kV隔离开关气室的温度—流体场有限元分析模型,计算出温度场分布,确定了外壳传感器安装位置.同时进行温升试验,将试验和仿真结果对比,验证仿真模型的合理性.接着利用支持向量回归机训练多点外壳温度、环境温度和触头温度的对应关系,并利用多点外壳温度和环境温度的实测来反演计算触头
针对550 kV GIS内隔离开关在实际操作中出现的传动链失效以及传动机构堵塞等问题,文中搭建了隔离开关等效模型,计算了等效负载转矩以及等效转动惯量,分析了隔离开关与电机操动机构的运动配合关系.在对其结构进行对比分析的基础上,采用Ansoft软件对2种不同故障下GIS内隔离开关分合闸驱动电机的转矩、电流以及加速度进行仿真分析.结果 表明,驱动电机在超过正常换相时刻范围后仍然没有检测到电流换相且电流基本稳定,则说明发生卡塞堵转故障;若第一次换相时刻较正常情况有较大差异,说明负载发生较大变化,时刻提前则有可能
分析直流偏磁对变压器造成的异常振动噪音规律是预防变压器故障的前提.为此,针对E型电力变压器,根据“铁心—绕组”模型分析了直流偏磁下变压器的振动噪音机理并利用Comsol搭建了电磁—振动—声场多物理场耦合模型,研究直流量大小、直流量从初级绕组流入和直流量从次级绕组流入两种情况下,直流偏磁对不同运行状况变压器的振动噪音规律和对绕组电压电流波形的影响.研究表明:直流量从初级绕组流入对空载变压器的影响最大,随直流量的增加铁心绕组上的振动噪音加剧且振动噪音最大值分布在铁心上;直流量从次级绕组流入对短路变压器的影响最
为了解决现有跌落式熔断器存在的维护操作危险问题,利用形状记忆合金(SMA)的温度形变功能,设计了一种新型可重复操作而不需要更换熔丝的12 kV跌落式熔断器.文中以SMA的双程记忆效应为基础,对原有跌落式熔断器的结构进行改进,利用SMA随温度形变的特性改变了现有跌落式熔断器的动作原理,变成由形状记忆合金控制的空气断口负荷开关与跌落式熔断器串联的“组合电器”,保留熔丝作为后备保护,提高了跌落式熔断器动作的可靠性.通过试验证明制作出的样品具有良好的机械电气性能,能通过可靠的动作实现其短路或过载保护的功能.本设计
为满足一二次融合成套开关设备接地故障测试的特定测量要求,提出了改进三点插值DFT算法,实现极短时波动周期下信号的高精度频率估计.算法基于最大旁瓣衰减窗,将DFT频谱实部和虚部拆分并分别进行三点插值计算估计;进而采用几何平均计算以消除负频率泄漏干扰影响;同时根据所得插值公式对算法在噪声下的统计特性进行了严格的数学证明.采用仿真验证算法有效性和准确性,仿真结果显示算法能够在任意波动周期及噪声干扰下,保持相对稳定且精度极高的校正估计准确性;最后将算法应用于实际12 kV一二次融合检测装置标准接地故障波形发生器输
针对等离子体电弧加热器的电气特性进行研究,建立了一种基于电弧电流、电弧电压和气流量的等离子体电弧神经网络模型.该模型主要考虑了电弧电流以及气流量对电孤电压的作用.利用MATLAB软件的Simulink模块建立大功率等离子体电弧模型,并与搭建的大功率晶闸管整流电源电路进行联合仿真.仿真得到的数据与实验数据进行对比分析,仿真结果表明:该模型可以准确模拟等离子体电弧的伏安特性,能够为后续等离子体电孤电源系统控制系统的参数优化,改善动态特性,实现电孤加热器实验系统参数匹配优化等,提供重要支撑.
近年来高压电缆缓冲层故障频发,可能由波纹护套与缓冲层空气间隙局部电场畸变引起,现有电场仿真研究缺乏对波纹护套压纹深度、节距以及缓冲层阻抗的考虑.文中基于麦克斯韦方程建立了考虑电缆波纹金属护套实际几何结构的数值仿真模型和平滑金属护套电缆的电路计算模型,定量分析了110 kV电缆缓冲层材料电导率和介电常数以及波纹金属护套几何结构对空气间隙电势与电场分布的影响.研究表明,当缓冲层材料电导率在10-6~ 10-9 S/m时,空气间隙电势主要受缓冲层材料电导率的影响;当缓冲层材料电导率小于10-9 S/m时,空气间