Siamese-ELECTRA网络结合对抗训练的FAQ问答模型研究

来源 :软件导刊 | 被引量 : 0次 | 上传用户:husong724
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
FAQ问答系统可基于用户提出的问题在标准问题集合中自动检索出一条或多条最相似的问题,并以该问题的标准答案作为解答。针对传统基于向量空间模型的方法只能表征文本浅层语义变化,以及BERT模型句对分类任务预测效率低等问题,提出一种基于Siamese-ELECTRA网络的FAQ检索式问答模型,将语义上相似问句的特征向量映射到相近的空间,基于向量距离公式快速计算语义相似性得分。同时,为了提升模型的鲁棒性和泛化能力,在训练模型时加入对抗训练算法FGM,对嵌入层参数矩阵进行梯度扰动;针对FAQ数据集通常只标注正样本导致
其他文献
为在嵌入式平台上实现说话人识别,分析研究说话人语音信号预处理、特征提取及GMM模型基本原理,并应用MATLAB实现基于GMM模型的说话人识别系统。基于TIMIT语料库,通过调整GMM阶数和语音时长,对系统性能进行验证分析。实验结果表明:①随着GMM模型阶数的增加,识别率随之提升,但计算量也急剧增加,当阶数达到16附近时,识别率则不再提升,反而出现了降低的趋势;②增加训练样本时长可从总体上提升识别率,但达到一定程度后便很难再继续提升。该结果对于在嵌入式平台上实现说话人识别具有较高参考价值。
为了提高交通时间预测准确度,建立一种基于ABiLSTM与XGBoost的组合模型。首先,在BiLSTM模型上添加注意力机制,使模型能够对不同时间步赋予不同权重的关注,实验证明添加了注意力机制的ABiLSTM模型相较于BiLSTM模型具有更好的预测能力;其次,使用遗传算法和hyperopt对XGBoost中的参数进行调节,选用表现最好的参数作为组合模型的组成部分;最后,使用误差倒排法和最小绝对值法将ABiLSTM模型与经过调参之后的XGBoost模型进行组合。实验证明,使用了最小绝对值法的组合模型相较于任何
目的:分析白内障术后患者出现感染性眼内炎的因素与围术期护理的效果。方法:2017年5月-2020年5月收治实施白内障手术的患者80例,随机分为两组,各40例。统计两组患者术后出现感染性眼内炎的相关危险因素,随后提供不同的护理措施。对照组实施常规护理;观察组实施围术期护理。比较两组患者炎性因子指标水平。结果:多因素分析显示,感染性眼内炎的发生主要与高龄、糖尿病史、手术时间、手术位置等因素有关;观察组白介素-6(IL-6)、白介素-8(IL-8)、肿瘤坏死因子-α(TNF-α)及白细胞计数(WBC)水平均低于
目的:探析细节护理应用在结核性脑膜炎患者中的效果。方法:2019年5月-2020年6月收治结核性脑膜炎患者73例,随机分为两组。对照组给予常规护理;研究组给予细节护理。比较两组护理效果。结果:研究组并发症发生率低于对照组,差异有统计学意义(P<0.05);研究组生活质量各项评分均高于对照组,差异有统计学意义(P<0.05);研究组护理满意度高于对照组,差异有统计学意义(P<0.05)。结论:细节护理应用在结核性脑膜炎患者中的效果显著。
堆叠物体的抓取在工件分拣等方面有着重要作用。为了实现对堆叠球体的抓取,对图像进行中值滤波后,采用霍夫变换检测图像中的圆,确定每个小球的圆心及半径。然后根据相机标定原理,通过异面直线的概念反解出圆心点对应的三维空间坐标,误差可控制在1%之内。最后控制机械手抓取目标物,利用视觉形成闭环。研究表明,系统可完成堆叠小球顺序抓取。
目的:了解基层医院进行前列腺穿刺活检的现状及穿刺患者的临床特征。方法:选取2014-2019年行超声引导下直肠前列腺穿刺活检的患者241例,比较不同年份、不同年龄段、不同危险程度分级的穿刺活检例数及穿刺阳性例数。结果:241例患者经病理活检确诊前列腺癌81例。2014-2015年、2016-2017年、2018-2019年前列腺穿刺例数分别为33例、76例、105例;穿刺阳性例数分别为15例(34.88%)、28例(32.94%)、38例(33.63%);前列腺穿刺活检例数逐年升高,差异有统计学意义(P&
目的:探讨PDCA循环在血液透析体外循环凝血中的应用效果。方法:选取2018年9月-2020年3月进行血液透析的患者108例,随机分为两组,各54例。对照组给予常规护理管理;研究组在常规护理管理基础上给予PDCA循环管理。比较两组临床效果。结果:研究组管路及透析器凝血Ⅰ级的发生率明显低于对照组,差异有统计学意义(P<0.05);研究组干预后患者自我概念、健康知识掌握、自我责任感、自我护理技能及自护能力总评分均明显高于对照组,差异有统计学意义(P<0.05)。结论:对血液透析的患者行PDCA循环
目的:探讨建立血液供需预测模型在优化血液管理及保证血液临床供应中的应用效果。方法:分别应用灰色预测和BP神经网络模型对2007-2019年潮州市中心血站采集量和临床供血量进行统计分析,利用平均绝对百分比误差法(MAPE)对单一预测结果进行权重分配,建立组合预测模型(BGM混合模型)。最后利用BGM混合模型,对2020年、2021年和2022年的采集量和临床供血量进行短期预测。结果:BGM混合模型在血液采集和供给量的相对误差分别为1.62%、2.69%,均优于单一的灰色预测模型和BP神经网络模型。结论:血液
为了降低电动汽车在物流配送过程中的成本,根据电动汽车类型的多样性,主要从电动汽车的容量限制、单次行驶里程、充电方式等方面考虑,提出多车场多车型电动汽车车辆路径问题。针对该问题建立数学模型,并提出一种二阶段算法对模型进行求解。第一阶段使用K-means聚类算法对客户进行分组,第二阶段使用改进的蚁群算法为已分组客户规划TSP路线。改进蚁群算法规划的路线距离相比传统蚁群算法最多减少了37.5%,总成本降低了19.3%。最后结合算例对提出的二阶段算法进行检验与分析。通过对6组实例求得的结果分析得出二阶段算法求解正
为挖掘患者治疗中诊断疾病指标变化特点,提出一种疾病辅助诊断模型(DAM_XGCN)。首先使用XGBoost预处理中西医指标数据,将指标诊断重要性排序结果可视化;其次将高等级指标及患者就诊时序信息输入到图卷积神经网络中进行训练。以三甲医院名医亲自记载近17年的临床医案为基础,得到一/二/三维乙肝小、大三阳指标组合的交/差集结果,该模型预测结果准确率达72%,比传统方法提高10%以上。DAM_XGCN模型不仅可有效学习中西医诊断指标间的复杂关联信息,辅助医生临床诊断,而且能追踪模型中各环节输出结果。