检索式对话系统中的主题建模设计与实现

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:kuwa_li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,开放域(闲聊型)对话系统越来越受到人们的关注,相对于传统信息服务形式(如问答系统、搜索引擎等),开放域对话系统提供更丰富语义内容和更有效的交互模式,这些特性使得其在可预见的未来生活中越来越普及,因此开放域对话系统相关技术的研究具有极大的经济效应和社会价值。随着深度学习在自然语言处理领域的飞速发展,对话系统正伴随着便携移动设备市场的拓展走向成熟,在客服、金融、医疗、教育和生活服务等方面应用广泛。开放域对话系统按照其回复产生的方式可以分为检索式与生成式两种方式:检索式对话系统通过匹配技术从系统回复库中检索与用户查询匹配的话语并排序,选取出排名最高的回复,该方法具有回复质量高的特点,但是其依赖于人工撰写的大量对话数据;而生成式对话系统基于数据驱动的方法能训练回复生成模型,该方法具有灵活性更好并可自动生成新的回复等特点,但是容易生成通用的无内容回复。目前的开放域对话模型研究工作大多基于神经网络的方法,由一个端到端的神经网络模型产生对话回复或者对候选回复排序。这种端到端模型的缺点在于难以解释对话的生成或排序过程。为了增加对话过程的可解释性并避免开放域对话系统两类方法的主要问题,本课题研究了融合主题的检索式对话系统,通过用户当前输入与历史对话信息预测回复的关键词与主题信息,并利用关键词与主题检索候选回复进行排序,从而保证回复的多样性。本文主要进行了以下三项研究工作:(1)对话数据的关键词抽取建模。为了从无标签的大量对话数据中获得对话的主题信息,本文对聊天数据进行了人工标注,提出了序列标注方法与分词信息结合的关键词抽取模型,从对话中抽取关键词,并通过实验验证模型的性能。(2)对话主题与主题词预测建模。为了建模多轮对话场景中的主题迁移与主题的一对多现象等,提出了基于序列生成方法的主题预测模型,并使用变分模型建模关键词预测任务,最后通过实验验证模型能够达到预期效果。(3)构建融合主题的检索式对话系统。结合前两章的研究内容,提出融合主题信息的检索式对话系统,使用预测的回复主题与主题词检索候选回复并排序。并构建了一个演示系统,能对用户的输入提供主题相关的回复。
其他文献
上海是中国最大的沿海城市和经济中心。由于地势低平,加之气候变化和城市快速发展,上海市长期以来受到洪涝灾害的威胁。黄浦江贯穿上海市中心城区,也成为了上海市洪涝灾害的主要来源。台风季节,台风带来的强降雨、风暴增水,如与天文高潮位“三碰头”,则可能对整个上海城市防汛带来巨大的压力。数十年来,为确保人民生命财产安全,黄浦江沿岸防洪系统不断地得到加固、加高。本研究借鉴荷兰VNK2堤防系统洪水风险的分析方法,
我国每年果蔬产量很高,但果蔬本身具有易腐性,导致新鲜果蔬大量损耗,造成极大浪费。果蔬腐烂变质一大原因是采后果蔬因呼吸作用产生乙烯,当环境中乙烯浓度超过果蔬的阈值浓度
当前我国高等教育产业发展迅速,在国家不断加大经费投入的同时,对高校财务管理工作而言也面临着更高的要求和挑战。合同管理作为高校业务层面内部控制的重要组成部分,具有业务流程长、影响面大、涉及利益复杂等特点。随着高校规模日益扩大,业务范畴越来越广且愈加繁杂,伴随签订合同而来的风险,造成教育事业发展发生经济损失的几率越来越大,由此借助合同或协议来对权力进行约束的需求也愈发强烈,因此如何完善高校合同管理内部
近年来我国突发环境事件频发,本研究以泉港碳九泄漏事故为例,采用文本分析法和内容分析法,借鉴批判性话语分析的相关理论,按照从话语表达到话语实践的思路研究环境突发事件中
以四苄基糖(或2,3:5,6-二异丙叉基-D-甘露糖)为起始原料,经过NaBH4或LiAlH4还原、单对甲苯磺酰化、分子内环醚化反应、脱保护等步骤合成了四个脱水糖醇,总产率55%~75%,其结构经1H
以吡咯和硝基苯甲醛为原料,二氯甲烷为溶剂,采用碘催化水浴法于35℃反应5 min合成了5-(4-硝基苯基)二吡咯甲烷(2a)和5-(3-硝基苯基)二吡咯甲烷(2b),其中2b为新化合物,收率分别为82%和
随着城市化发展的进程,中国传统建筑材料被新兴的建材频繁替换,设计中重造型轻文化的现象比比皆是,显现了传统文化根源性的流失和传统精神本质的旷缺。在此背景的影响下,传统