多信息融合的短文本对话生成方法研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:lan737898
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新浪微博,百度贴吧,推特和Ubuntu社区等社交平台的飞速发展,网络上出现了大量一问一答形式的短文本对话数据,这为短文本对话的研究提供了良好的数据基础,也促使其成为近期自然语言处理领域的一个研究热点。针对中文短文本对话的特点,本文在基于Transformer神经网络的序列到序列的框架下融合句法和情感等信息,以提高中文短文本对话生成的质量。具体地,本文的研究内容主要包括以下三个方面:1.高效的短文对话生成模型:为了提高对话生成效率,本文采用一种基于Transformer神经网络的序列到序列框架来对短文对话生成任务进行建模。首先,本文采用Transformer神经网络模型进行特征自动组合与提取。并通过预训练词向量方式来提高模型性能。此外,在模型预测解码中采用柱搜索策略,以减少错误传播。为了验证实验方法的有效性,本文采用基于GRU+Attention的神经网络的Seq2Seq对话模型作为基线方法。实验结果表明,在对话生成模型中,Transformer模型性能要优于GRU+Attention模型。2.融合句法信息的短文本对话生成模型:为了提高对话模型生成的语法性和用词多样性,本文在高效的短文本对话生成模型上进一步融入句法信息。在神经网络模型的设置下,主流方式时使用Tree-GRU提取句法信息。在本文中,我们的对话模型使用了神经句法解析器隐藏层来代替这种方式。特别地,本文训练了一个神经句法解析器,来获得句子的句法树以及神经网络隐藏层。分析实验结果表明:在短文本对话生成模型引入神经网络隐藏层不仅能有效提高生成出句子的质量,也能有效减少错误传播。3.融合情感信息的短文本对话生成模型:为了有效控制对话生成的情感极性,本文在句法信息增强的短文对话生成模型基础上进一步加入情感信息。特别地,本文在神经网络的设置下,比较了两种融合情感信息的方式:即简单情感融合和基于条件变分自编码模型的情感融合。实验结果表明:使用情感信息能有效降低短文本对话生成模型的困惑度,另外采用基于条件变分自编码模型,短文本对话生成模型能产生情感极性更准确的Repsonse。
其他文献
北京富华金宝中心工程地下结构外墙混凝土取消柔性防水,完全依靠混凝土结构自防水,并通过混凝土配合比精心设计优化和施工单位细致的施工和养护,既保证工程质量,又缩短了施工
罗伯特.杰维斯的《国际政治中的知觉与错误知觉》从认知心理学的角度,对国际政治中的决策形成机制进行了分析,对于错误知觉的产生、类型及解决途径提出了自己独到的见解。认
我国大城市轨道交通是近几年来重要的基础设施建设,但伴随而来的噪声对环境污染是个亟待解决的问题。通过对地下轨道交通通风系统声源的分析,介绍了大风量通风消声及末端至风
平面Stewart平台是一个三自由度并联机构,平面广义Stewart平台是其推广形式。它由一个位置固定的刚体(称为基座)、一个移动的刚体(称为动平台或平台),以及刚体间的三对点/线、点/点或线/线间的距离或角度约束组成。并联机构的工作空间分析是机构设计、轨迹规划、参数选取等过程的基础工作,同时也是评价并联机构工作能力的依据。本文主要对以下内容展开了研究:1、根据平台与基体之间的约束类型,通过约束所
临床资料 2例诊断为慢性肾功能不全(尿毒症期)患者,1例为52岁男性,原发病为高血压病;1例为34岁女性,原发病为慢性肾小球肾炎。两者均为规律透析1年以上,每周3次,每次4h,碳酸氢盐透析,费
目的:透明矫治器是一项新兴的融合了现代口腔正畸学、数字化图像采集与处理、牙移动可视化模拟软件、3D打印、热压成型工艺等多项学科的新型矫治器。按照设计的矫治方案,制作一系列逐步递进的热压成型高分子聚合膜片,通过与正畸牙外形间的差异产生形变,以其回弹力为正畸力,完成矫治目标。膜片厚度和戴用时间是影响牙移动的重要因素。目前大部分透明矫治器采用单一厚度的膜片,厚薄两种膜片组合可以改善患者对牙移动效果仍不明
探讨了采用排汽屋面的施工方法解决屋面渗水的问题.
采用文献查阅、实验研究和统计分析相结合的方法分析影响运动记忆的距离因素和重量因素。通过对同一年龄阶段和教育背景的被试进行实验研究,发现在四种不同的书写方式下,即:常
本文结合射线技术和表面积分的方法来分析电大尺寸含频率选择表面天线罩的电气性能并用Visual Fortran实现了计算速度快、计算结果相对可靠的电大尺寸口径天线-含频率选择表
介绍了定长缠绕玻璃夹砂管在石狮引水工程中的设计与安装,以及所取得的效果.