一种基于BERT的中文NL2SQL模型

来源 :山东大学 | 被引量 : 0次 | 上传用户:erkonga
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Bert模型为Google开发的基于Transformer Encoder的大规模语料预训练语言模型,在自然语言处理领域(Natural language Processing)近乎各个子领域内均获得了大幅度的突破。本文在基于Bert作为数据增强的基础上,研究对当前人工智能领域中的一个实用性任务:NL2SQL(即“自然语言转SQL语句”任务)。创新地设计了新型的针对19年发布的首个中文NL2SQL数据集的深度学习模型,并达到了87%左右的准确率,接近了当前State-Of-The-Art模型X-SQL在英文NL2SQL数据集WikiSQL上的表现。
其他文献
关于冻干制剂称量失重"问题的探讨扬州制药厂药物研究所225009方行笔者对本厂冻干制剂按中国药典1995年版二部附录第5页装量差异项下规定方法检查时发现,称量失重"会造成严重的分析误差
介绍了几种分子标记技术,概括了分子标记技术在家蚕遗传育种和品种鉴别中的应用情况,分析了分子标记技术在家蚕遗传育种上的应用前景。
《浙江省促进散装水泥发展和应用条例》于2010年1月1日起开始正式实施,根据要求,从2010年7月1日起金华市将逐步禁止在城市城区现场搅拌砂浆,以加快节能减排的步伐。
伴随着移动4G网络的到来以及无线网络的大面积覆盖、web3.0的迅猛发展以及智能手机、平板电脑的快速普及,催生了微博客户端(移动微博),并且迅速在全球范围内成长发展。移动微
全光纤Fabry-Perot(F-P)干涉型应变和超声传感器具有体积小、灵敏度高、耐腐蚀等优点,在结构健康监测、医学超声诊断、水声探测等领域具有重要的应用。本文通过对近年来光纤
基于钛白粉在塑料中的应用,运用X射线粉晶衍射(XRD)、扫描电镜(SEM)、透射电镜(TEM)、粒度分析、紫外线吸收、化学分析等手段对国内外7个厂商生产的钛白粉样品进行了成分、结构和功
对江苏省丰县426个农业用地和213个蚕桑用地的样本土壤养分进行了调查化验,结果显示:丰县蚕桑用地有机质含量为8.8 g/kg,比一般农业用地低3.2 g/kg;全氮含量为0.99 g/kg,比一
在盛夏时节高温条件下,用24%帕力特悬浮剂1 250倍、1 667倍、2 000倍药液进行了桑园防治桑蓟马试验,结果表明:不同浓度间药效差异不显著,喷药后4d防治效果均可达到90%以上,用24%
本文简要介绍了每一卫星计划中计划的直接费用,计划直接费用包括总载荷费用和运载火箭直接费用,并且列表叙述了现行一次性使用的运载火箭的直接费用。同时还介绍了每次飞行的
简单介绍了高速逆流色谱(HSCCC)技术及其在药物分离分析中的应用。通过参阅国内外的文献报道,综述了HSCCC的仪器类型、特点、溶剂系统、技术发展及近年来在分离分析天然产物、蛋