【摘 要】
:
随着人工智能浪潮的兴起,人机交互技术逐渐成为研究的热点,其中一个重要的研究方向是对话系统。在对话系统中应用面较为广泛的是任务型对话系统,而任务型对话最核心的模块是用户意图分析,其主要包含意图识别和槽位填充两个子任务。目前的对话意图分析是基于数据驱动的,在拥有大量标注数据情况下,意图识别和槽位填充任务可以取得优异的效果。然而在实际应用中,获取大量真实的用户对话语料十分困难,而且对语料的标注也会消耗大
论文部分内容阅读
随着人工智能浪潮的兴起,人机交互技术逐渐成为研究的热点,其中一个重要的研究方向是对话系统。在对话系统中应用面较为广泛的是任务型对话系统,而任务型对话最核心的模块是用户意图分析,其主要包含意图识别和槽位填充两个子任务。目前的对话意图分析是基于数据驱动的,在拥有大量标注数据情况下,意图识别和槽位填充任务可以取得优异的效果。然而在实际应用中,获取大量真实的用户对话语料十分困难,而且对语料的标注也会消耗大量的时间,还可能存在漏标、错标等情况;此外,在许多对话应用场景中,用户的意图也是不断变化的,这也需要意图分析模块能够迅速适应新的领域并做出合理地相应。因此,提高少样本情况下意图识别和槽位填充的性能是很有必要的。本文将从数据、模型和算法三个层面来探究少样本背景下的意图识别和槽位填充。首先是数据层面,本文使用了基于关键词的增量预训练和对抗训练实现领域知识迁移并增强模型的鲁棒性。其中本文使用TF-IDF和Text Rank提取领域内关键词,采用对关键词进行掩码训练的方法有效缓解了训练数据和测试数据领域不一致的问题。此外,本文通过对关键词对抗训练缓解了数据量较少导致模型容易过拟合的问题。其次在模型层面,本文以多任务学习框架为基础,通过对基于度量学习的少样本意图识别模型改进取得了更好的实验效果。本文首先使用胶囊网络改善意图向量,然后通过融入注意力机制使得意图信息指导槽位填充,接下来利用对比学习区分了稠密的度量空间,最后制定槽位转移规则避免不合理的转移情况出现,上述方法在主要的评价指标上均取得了较好的效果。最后在算法层面,本文结合提示学习算法与原型网络思想进行意图识别,利用Seq2Seq框架进行槽位填充。提示学习算法可以充分发掘模型的潜能,增强少样本模型的表征能力和泛化能力。本文通过构造模板并利用模型预测模板掩码的标签词,最后针对标签词进行答案映射。实验证明,使用预训练模型进行提示学习可以逼近甚至超过微调的效果。
其他文献
随着互联网技术和生物医学领域的不断发展,能够在线获取的生物医学文献数量增长迅速,这些文献中往往蕴含着大量有价值的医疗保健信息和生物医学数据,是该领域研究工作中十分宝贵的资源。作为信息抽取的核心子任务,关系抽取可以检测出实体之间在无结构化或非结构化的自然文本中所表达的语义关系,对于推动生物医学的发展具有重要意义。生物医学领域的有监督关系抽取通常受限于人工标注数据集的规模和成本,难以满足深度学习方法对
生物信息技术的飞速发展使得各类生命活动被不断深入研究,新一代高通量测序为科研人员提供了海量的遗传数据,这对医疗、农业、环境保护等领域的发展产生了巨大的推动作用。当前新冠肺炎(COVID-19)在全球肆虐,严重威胁着世界人民的生命健康,在这样的情况下,如何利用已有的大量数据来预防和治理各类相关的问题已经成为了当下讨论的主流,越来越多研究人员的加入使得一些原有问题得到了很好地解决,但是仍旧存在诸多难题
方正断陷位于松辽盆地东侧依舒地堑北段,隶属于依舒地堑的次级构造单元。研究区重点含油层系为白垩系地层,目前钻井证实研究区构造较为复杂,失利井较多,因此开展白垩系油气成藏条件研究尤为重要。通过对研究区成藏条件的分析,可为大庆油田增储上产提供理论支撑。本论文结合沉积地质学、石油地质学和构造地质学,综合运用岩心、测井、录井和生产动态等资料,对研究区的构造演化特征、沉积储层特征和油气成藏条件进行分析,最终圈
<正> 案一、肺痈 陈××,男,57岁,住院号30863,因发热,胸痛、咳咯脓血性腥臭痰,于76年7月22日由外科病房转入。 患者6月25日,因“胆囊炎”收住院,行胆囊切除术后发热咳嗽,X线胸片显示:“右侧中肺门区可见一片状密度增高阴影,边缘模糊不清,其中可见透朋亮区并液平面,其壁较厚”经中医会诊改服中药。 初诊:形体消瘦,发热咳嗽,汗出而喘,短气但坐,咯脓血痰,味腥量多,胸痛烦闷,
随着信息技术的发展,医学健康数据呈指数级爆炸式增长,数据变得越发庞大冗杂,医疗健康术语或概念实体之间的关联分析利用面临巨大挑战。针对此方面问题,本文在建立医疗健康知识图谱的基础上,利用特征学习的方法实现基于特征空间的医疗健康知识图谱检索和医疗健康文献询证检索。本文的主要工作有:(1)研究大规模医疗健康领域知识图谱的构建方法。从数据采集处理、知识抽取以及实体消歧等方面开展深入研究并构建医疗健康知识图
图作为一种表示事物之间关系的常用抽象数据结构被大量应用在现实的许多场景中。例如,论文引用网络、社会关系网络、交通网络等。由于人工神经网络对于传统机器学习任务的革新以及其取到的良好的效果。目前,将人工神经网络应用到图结构的任务之上已经成为一种趋势。该种任务需要使用到结构信息,因此我们有必要对图的结构进行深入的研究,这将有助于我们理解图的结构和提升与之相关的下游任务的效果。例如,节点分类、节点推荐、链
<正>2023年1月18日,全国农业农村厅局长会议召开。会议强调,要全面贯彻落实党的二十大和中央经济工作会议、中央农村工作会议精神,坚决守牢确保粮食安全、防止规模性返贫等底线,扎实推进乡村发展、乡村建设、乡村治理等重点工作,加快建设农业强国,建设宜居宜业和美乡村,为全面建设社会主义现代化国家开好局起好步打下坚实基础。
<正> 发热有外感、内伤之分。余在临床中体会到,外感发热,由于病邪、病位、体质等不同,证候表现往往错综复杂,辨证宜综合运用六经、三焦、卫气营血等方法,融合伤寒、温病诸法诸方,随证变通,可获良效。
在互联网的普及和发展过程中,数据规模迅速增大,分布式数据库和并行数据计算框架逐渐兴起。并行数据库系统水平分区大量结构化数据,以便为分析工作负载提供并行数据处理能力。当对大量数据进行水平分区时,一个主要的挑战是:分区后执行查询时网络传输数据量低的同时,控制分区带来的数据冗余的额外存储成本。因此使用可扩展、高效的水平数据库分区方法是很重要的。而目前的分区算法大多数只考虑了网络传输代价,忽略了数据冗余所