结合约束条件的对话回复生成研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:qmail03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近,人机对话系统因其巨大的学术价值和商业价值而受到越来越多的关注。随着社交媒体和深度学习技术的迅猛发展,聊天机器人在生活中发挥着广泛的作用,它不仅可以满足人们的沟通需求,而且节省了企业的服务成本。为了更符合实际应用,人们往往研究多轮对话生成系统,这样可以利用更多的历史对话信息,同时也对如何更好地捕捉符合对话场景的特征提出了新的挑战。为了更好地对上下文信息进行建模,在多轮对话生成中,需要针对对话约束进行建模,捕获对话中的属性信息,提升模型的属性控制能力,增加生成回复的多样性。本文主要工作如下:首先,针对对话中主题与个性约束问题,本文提出了一种基于主题与个性约束的回复生成研究方法。日常对话中,对话者通常围绕特定的主题展开且每句话都有明显的情感和意图倾向。情感和意图描述了说话者的个性。该方法结合对对话的主题、情感、意图的识别,通过共享参数的方式实现对生成回复的主题、情感和意图的约束,从而生成具有合理的情感和意图且与对话主题相关的回复。其次,针对对话上下文约束问题,本文提出了一种基于上下文约束的回复生成研究方法。现有的多轮对话生成研究中往往忽略了对上下文子句关联进行建模的重要性。因此该方法旨在对上下文关联进行建模来提升生成回复的质量。在该方法中,主要考虑对上下文中相同说话者子句之间的关联和同一轮对话子句之间的关联进行建模。对相同说话者子句之间的关联进行建模,可以学习说话者在对话中承担的角色和对话动机;对同一轮对话子句之间的关联进行建模,可以学习说话者之间的逻辑交互信息。该方法使用图卷积网络对上下文关联进行建模,捕获上下文中的角色和逻辑信息。最后,针对结合对话中上下文与个性约束问题,本文提出了一种基于预训练模型与约束条件的回复生成研究方法。以往的研究中往往忽略了话语中的情感和意图之间的相关性。因此该方法旨在上下文约束的基础上利用情感和意图之间的关联提升个性约束的质量进而辅助回复生成。该方法中主要考虑利用生成式方法中解码时的条件概率来对情感和意图的关联进行建模,提高情感和意图识别的准确率。然后,将模型参数即学习到的这种个性信息迁移到对话生成中对生成的回复进行约束。
其他文献
二次电池是迄今为止最成功的储能设备,给我们的日常生活带来了巨大的改变。随着社会的进步和发展,储能需求从便携式电子设备向电动汽车转变,需要拥有更高能量密度的可充电电池。锂金属电池因为具有超高的理论容量(3860 mAh/g)和最低的负电化学电位(相比于标准氢电极为-3.040V)受到广泛的研究关注。然而,锂金属的高活性伴随而来的许多安全隐患需要解决:不可控的锂枝晶生长、锂金属电极与电解液之间的不可逆
学位
近年来,发展文化软实力一直是我国加快建设社会主义文化强国的重要战略,文旅融合为文化产业与旅游业的相互推动和发展带来了新的契机。苏州拥有“历史文化名城”“江南水乡”“人间天堂”等外界称谓,从苏州古典园林、大运河、古镇古村古街等特色文化资源到国家全域旅游示范区、特色小镇;从夜间文旅产品“姑苏八点半”“江南小剧场”到“苏州国际设计周”“威尼斯苏州周”等活动,丰富的文化资源、旅游资源、节庆活动、文化品牌等
学位
随着短视频平台的兴起与发展,高度显性化、货币化乃至职业化的儿童网红群体正在迅速扩大,伴随着全民“云养娃”式的追捧而来的还有来自社会公众关于父母或其他商业组织利用儿童牟利的争议。在此背景下,本文以短视频平台上的儿童网红为研究对象,借助数字劳工理论,结合参与式观察法、深度访谈法以及文本分析法,梳理儿童网红在短视频平台上的劳工化过程,确立儿童网红的数字劳工身份。另外,从父母、政府、公众三方面呈现各主体为
学位
文字作为一种记录语言的符号系统,古往今来,其不仅作为人类信息传递的重要工具,同时也是人类文明传承的载体,更是人类从原始过渡到文明的重要标志。在艺术领域,文字作为装饰图案广泛出现于建筑、服装等艺术设计当中,特别是在我国服装发展史中,文字作为古代皇家宫廷服饰中的重要装饰图案元素的发展历史极为悠久,并逐渐在发展的过程中形成了以本民族文字为代表的文字符号图案系统,其背后所承载的历史文化价值也使得文字的符号
学位
模仿学习是一种不依赖环境奖赏信息,从专家样本中学习最优策略的方法。生成对抗模仿学习结合模仿学习的决策能力与生成对抗网络的表征能力,在高维连续控制任务中展现了强大的智能性和良好的普适性,已经成为模仿学习领域的研究热点之一。然而,生成对抗模仿学习在模态表征能力、算法稳定性以及样本利用率方面存缺陷,严重限制了其在复杂现实任务中的应用。针对以上生成对抗模仿学习在对抗训练过程中出现的三个问题,本文提出了解决
学位
情绪分析作为情感分析的一个重要分支,因其广泛的应用而成为自然语言处理的研究热点。随着互联网的飞速发展,越来越多的人喜欢在以微博、推特为首的社交媒体平台上宣泄情绪,因此微博存在海量的情绪表达文本。目前,相对于英文情绪分析数据集,中文的情绪分析数据集较少。挖掘微博数据,构建高质量情绪分析数据集,对研究情绪分析具有十分重要的意义。然而,微博和推特存在文本短小、信息表达有限的问题,过去大多方法只考虑文本语
学位
近年来,文本和图像的细粒度语义匹配研究吸引了工业界和学术界研究人员越来越多的关注。文本和图像的细粒度对齐信息(例如:对齐图片中的目标对象与文本中涉及的短语实体)可以被广泛应用于很多重要的应用场景,例如:多模态检索、多模态情感分析、个性化推荐系统和线下门店数字化等。传统的文本图像细粒度匹配任务,旨在对齐图片和文本中的细粒度实体,并未就这些细粒度实体进行深入语义分析。本文通过语料分析发现,大多数用于描
学位
目的 探讨手法松解联合核心肌群训练治疗神经根型颈椎病的疗效及对血液流变学的影响。方法 选择2018年3月至2021年2月南京市高淳中医院收治的86例神经根型颈椎病患者为研究对象,按照数字表法随机分为对照组和联合组各43例。对照组采用核心肌群训练,联合组采用手法松解联合核心肌群训练,2组均持续干预4周。对比2组临床疗效及干预前、干预4周后颈椎病临床评价量表(CASCS)、视觉模拟评分法(VAS)评分
期刊
将深度学习与强化学习结合已经成为了一种主流趋势,但将其运用到现实环境还面临许多的挑战,仍需要大量的训练数据、高维度的观测空间以及精确的智能体输出端口,这些都需要更强大的探索算法,探索性的缺失将导致算法在多峰值函数的更新中陷入局部最优;然而过度的探索也会导致算法性能的下降,使算法的收敛速度下降。因此,如何平衡探索与利用的关系,加快算法的收敛速度,成为了强化学习算法的一个挑战。为了缓解上述问题,本文主
学位
2018年11月5日,科创板设立并试点注册制,国家设立科创板目的是给企业创新营造一个良好的资本市场环境,进而提升国家整体实力。科创板上市企业大部分是硬科技企业,具有的普遍特征是研发支出多。由于研发活动具有较高的资金风险,所以要准备充足的自由现金流规避资金风险。充足的自由现金流是企业进行研发支出,开展研发活动的驱动因素,研发支出的增加利于企业提高自身的创新能力,创新能力的提高可以有效促进企业实现可持
学位