【摘 要】
:
针对当前自动问答数据增强方法需要大量外部数据的问题,提出一个面向问答模型缺陷的数据增强方法.首先,在训练集上训练好问答模型、问题生成模型以及问答匹配模型;然后,获取问答模型在训练集上预测的所有答案,并选取其中预测错误的答案;再后,使用问题生成模型对这些答案生成相应问题;最后,通过问答匹配模型对生成的问答对进行过滤,保留其中质量较高的数据作为最终的增强数据.该方法不需要额外的数据与领域知识,同时能够针对模型构造特定数据,耗费较少的训练代价就能使模型性能提升.实验结果表明,所提出的数据增强方法对R-Net,B
【机 构】
:
苏州大学计算机科学与技术学院, 苏州 215000
论文部分内容阅读
针对当前自动问答数据增强方法需要大量外部数据的问题,提出一个面向问答模型缺陷的数据增强方法.首先,在训练集上训练好问答模型、问题生成模型以及问答匹配模型;然后,获取问答模型在训练集上预测的所有答案,并选取其中预测错误的答案;再后,使用问题生成模型对这些答案生成相应问题;最后,通过问答匹配模型对生成的问答对进行过滤,保留其中质量较高的数据作为最终的增强数据.该方法不需要额外的数据与领域知识,同时能够针对模型构造特定数据,耗费较少的训练代价就能使模型性能提升.实验结果表明,所提出的数据增强方法对R-Net,Bert-Base以及Luke均有效,与其他数据增强方法相比,在较少的增强数据规模下,问答模型获得更好的性能提升.
其他文献
随着全球气候变暖,滑雪运动呈现出对气候变化高度的敏感性和依赖性,各地滑雪季将不同程度地缩短.储雪作为一种应对气候变化的方法在雪务保障中逐渐得到研究和应用.在新疆阿勒泰地区吉木乃县开展储雪实验,应用谐波反应法研究了雪堆融化量与外界空气温度、太阳辐射和绝热保温结构热学性能之间的定量关系.实验中,覆盖两层绝热保温材料雪堆1的平均融化量为18.0 kg·d?1(相当于初始质量的0.85%),未覆盖绝热保温材料雪堆2的平均融化量为120.8 kg·d?1(相当于初始质量的6.67%).模拟期间观测到的雪堆1质量减少
生物安全是国家安全的重要组成部分,《中华人民共和国生物安全法》通过了全国人大常委会的审议,并自2021年4月15日起施行.生物遗传资源是国家可持续发展的重要战略资源和国家安全的重要物质保障,目前已成为世界各国资源争夺的新领域,随着生物技术、分子生物学、生物信息学的迅速发展,对生物遗传资源的安全管理,离不开法律法规等制度的规范.《生物安全法》的出台完善了中国的法律、法规等管理制度,但还需要进一步的细化.首先阐述了《生物安全法》的立法意义,介绍了《生物安全法》的层级地位及立法进程;然后,在《生物安全法》实施背
新疆维吾尔自治区喀什地区作为我国与中亚和欧洲的重要陆路货运口岸,来往货物运输频繁,引入新型冠状病毒(SARS-CoV-2)风险大,对我国新型冠状病毒肺炎(COVID-19)疫情防控造成压力.2020年11月我国新疆维吾尔自治区喀什地区发生输入SARS-CoV-2导致的本土聚集性COVID-19疫情.为明确货物运输载体携带SARS-CoV-2的基因特征以及边境快速物流系统作为SARS-CoV-2传播载体的可能性,本研究对2020年11月6日-2020年11月10日期间在喀什边境口岸货运卡车及运输的集装箱采集
诺如病毒(Noroviruses,NoVs)是引起全球急性胃肠炎的常见病原.组织血型抗原(Histo-blood groups antigens,HBGAs)是NoVs黏附因子(受体),能促进病毒感染宿主细胞.NoVs主要衣壳蛋白突出(Protruding,P)区是与HBGAs结合的关键结构域.本研究构建了非流行毒株GII.26型NoVsP区的原核表达重组质粒,以谷胱甘肽巯基转移酶(Glutathione s-transferase,GST)亲和层析纯化P蛋白,人鼻病毒的3C蛋白酶去掉GST标签,通过酶联
人肠道病毒A组71型(Enterovirus A71,EV-A71)和柯萨奇病毒A组16型(Coxsackievirus A16,CV-A16)是引起手足口病(Hand,foot,and mouth disease,HFMD)的主要病原体.近年来非EV-A71和非CV-A16的其他肠道病毒(Enterovirus,EV)已成为HFMD流行或暴发疫情的优势病原体.安徽省HFMD监测数据显示,2017-2018年HFMD样本非EV-A71和非CV-A16其他EV核酸阳性率超过50%,其中大部分为柯萨奇病毒A组
介绍了“多测合一”政策的出台背景,汇总了国家和省级层面“多测合一”的政策文件和主要内容,总结了政策出台以来全国范围的主要学术活动,归纳了省级层面“多测合一”的技术标准及其特点,罗列了国内主要的多测合一商品化软件,展示了国内各地典型多测合一管理信息系统,报告了取得的主要学术成果.对已开展的“多测合一”工作进行了评价,提出了改进“多测合一”工作的6条建议.
人源诺如病毒(Human noroviruses,HuNoVs)是全球引起急性胃肠炎的重要传染病原.该病毒遗传多样性丰富,包括了5个基因群以及39种基因型,免疫学检测受限.因此,本研究旨在制备广谱性的HuNoV单克隆抗体,并建立可检测多种基因型的双抗体夹心ELISA方法.本研究通过表达纯化流行毒株GII.4型HuNoVs衣壳蛋白P颗粒免疫Balb/c小鼠,筛选出3株能稳定分泌单克隆抗体的杂交瘤细胞株,制备单克隆抗体并进行评价.利用辣根过氧化物酶对抗体进行标记及配对筛选,建立了HuNoVs双抗夹心ELISA
水痘-带状疱疹病毒(Varicella-zoster virus,VZV)是引起水痘和带状疱疹这两种临床表现不同病症的共同致病原,其基因组中ORF43是VZV在宿主细胞中复制的必需基因,但目前尚无针对VZV ORF43编码蛋白性质与功能的研究报道.本研究目的 是制备抗VZV ORF43单克隆抗体,以初步研究该蛋白在细胞内的表达与分布情况.本研究构建了VZV ORF43蛋白的原核表达质粒并在大肠杆菌中进行了该蛋白的表达,纯化蛋白免疫小鼠后,使用杂交瘤技术及克隆化筛选,获得一株特异性强、反应性好的抗VZV O
为了对知识库(KBs)进行补全,提出一种新的基于路径的推理方法,使用注意力机制,将实体与其类型相结合,共同对路径中的实体进行表示,并使用注意力机制对每条路径预测的关系向量与给定关系的表示向量之差的绝对值进行汇总来计算模型的置信度.在基准数据集WN18RR和FB15k-237上的实验结果表明,与现有的基于路径的关系推理方法相比,所提方法具有更好的性能.
为建立小鼠轮状病毒(Rotavirus,RV)感染动物模型,研究可同时表达轮状病毒NSP4 (Nonstructural protein 4)和VP7(Viral protein 7)的重组腺病毒疫苗免疫孕鼠后对新生乳鼠感染RV的被动保护作用.新生乳鼠口服异源株轮状病毒Wa、ZTR-68或SA11株后(分2次给予,每次含5×104 CCID50的RV),观察乳鼠是否有腹泻症状、肠道病理变化,检测乳鼠粪便排毒百分率;另以重组腺病毒rAd-NSP4-VP7免疫孕鼠后,检测母鼠血清抗体产生情况,并对比乳鼠粪便中