【摘 要】
:
传统的检索式问答系统,通过字面相似度进行匹配,可以快速检索出相应的内容,但是准确率不高。而基于深度学习的问答系统能够有效解决准确率的问题,但是,训练阶段通常依赖大量的数据资源,而且预测时需要较多的计算时间。文中提出了一个以文本匹配为核心的FAQ问答系统,该系统由文本检索,文本匹配两大部分组成。文本检索部分通过快速筛选,减少了系统用时和文本匹配阶段的数据计算量。文本匹配部分采取了预训练和微调两阶段的
论文部分内容阅读
传统的检索式问答系统,通过字面相似度进行匹配,可以快速检索出相应的内容,但是准确率不高。而基于深度学习的问答系统能够有效解决准确率的问题,但是,训练阶段通常依赖大量的数据资源,而且预测时需要较多的计算时间。文中提出了一个以文本匹配为核心的FAQ问答系统,该系统由文本检索,文本匹配两大部分组成。文本检索部分通过快速筛选,减少了系统用时和文本匹配阶段的数据计算量。文本匹配部分采取了预训练和微调两阶段的训练方式。预训练由自然语言处理领域最新的BERT模型完成,使用少量数据以及计算资源,即可获得较高的准确率。为了进一步提升匹配的准确率,在微调阶段做出了以下改进。首先在BERT模型的基础上,使用融入了Attention机制的卷积神经网络,进行局部特征的提取和重要性区分,在测试数据集上,取得了比BERT模型更好的成绩。其次,在上述模型的基础上引入协同训练算法Tri-Training,通过多个分类器的差异化学习,来提升模型整体的语义能力。进一步,Tri-Training训练算法在提升模型性能的同时,也给分类器带入了噪声,为了降低噪声的影响,为每个分类器加入了一个可动态调整的概率阈值。结合以上几种方法,最终模型在客观评价标准上获得了更好的效果。相对基线模型BERT,整体性能在QQP数据集上提升了1.5%,而在IQA数据集上提升了1.9%。
其他文献
在中医学术的历史进程中,《脉书》与《灵枢》等早期经络文献即含有中医整体观理论与辨证论治方法,对经络学说的继承和发展极为重要。经络学说所合的辨证论治模式也为后世八纲及
光催化还原CO2转换为碳基燃料作为一种无污染、可持续发展的新能源途径,对改善温室效应和缓冲能源紧缺问题意义重大。而开发高性能和高稳定性的光催化剂一直是CO2光催化转化技术的核心。然而,现有常见的单一组成和结构催化材料绝大多数都存在光利用率低、量子效率低和催化寿命短等问题。所以,通过构建多元复合材料,利用组成元素之间的功能协同、能带耦合是未来发展探索高效Co2光催化材料的主要开发方向。本论文选择了几
目的分析优质护理干预在改善维持性血液透析患者心功能及消极情绪的应用效果.方法选取本院采用接受诊治的140例肾衰竭患者作为研究对象,根据随机数表法分为对照组、研究组,各
从教学实际出发,结合理论研究,从STS教育的特点、STS教育与化学教育改革实施、STS教育在化学新课标下的具体定位等几个方面对化学教育中的STS问题进行初步探讨.
介绍了中药渣出渣方案的设计过程,对方案中的运渣车、输送设备、提升设备、储渣仓等设备进行对比选型,最终确定采用双螺旋运渣车、螺旋输送机、管链输送机和螺旋式储渣仓等设
一、引言根据Halliday的功能语法理论,语言有三大功能:概念功能(ideational function)、人际功能(interpersonal function)和语篇功能(textual function)。语篇功能包括三个子系统:即
有才华的人应该也有勇气。他必须敢于信赖他的灵感,他必须确信在他脑海里忽然闪现的奇想是健康的,确信他感到得心底手的文学形式,即使那是一种新的形式,也有权利维护它的存
利用过程能力指数评价过程能力,其可靠性程度会受到抽样误差、测量误差以及数据自相关性的影响,分析了观测数据受各种因素影响下过程能力指数估计的统计性质,给出了通过添加
研究目的:研究因矿区扩大生产规模引致村庄和人口迁移对于矿区景观格局变化的影响。研究方法:以山西省平朔矿区为例,结合其开展的三次村庄和人口搬迁,通过1987年、1996年、2001年
在高层建筑结构设计中,短肢剪力墙结构是一种常见的结构。这主要得益于其不仅成本低,而且具有较强的抗震性和较广的空间,同时还能建筑在观赏方面的需求。作为高层建筑结构设