融合主题模型的文本生成技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:crr0808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于自然语言文本的抽象语义与内容多样等特征,文本生成方法面临两方面的挑战:一方面,自然语言文本在表达上形式多样、上下文内容动态变化,需要能准确理解并在线建模大规模文本上下文内容的方法。另一方面,基于模型的文本生成方法其生成的内容在语义上容易出现上下文主题不一致的情况;针对以上问题本文开展了基于主题模型的文本生成方法研究,旨在基于动态主题模型对文本的上下文内容进行动态建模,并且提供在线处理大规模数据的能力,同时通过上下文主题的一致性,指导模型的生成过程,文章的主要贡献如下:1.针对文本生成过程中,生成序列的上下文语义动态建模问题,本文提出了一种面向大规模文本在线主题建模的动态建模方法(Dist HDP),主要解决两方面问题:1)文本生成应用中需要处理各类型主题变化的动态文本数据(例如对话生成场景中,上下文对应的主题分布随着会话的推进而变化),传统基于LDA的静态主题模型在使用语料训练时,需预先指定主题个数,难以适应主题内容与数目动态变化的问题。2)现有在线主题模型主要关注单机情况下的模型表达能力,难以适应大规模文本数据的动态主题建模需求。针对以上问题,本文在在线变分HDP的基础上,设计并实现了并行在线变分HDP主题模型算法。将训练任务分为多个子任务并分布在多个工作节点上,从而加快了整个训练过程。通过并行变分推理算法可以保证模型的收敛性。最后在真实数据集上进行了3组实验并证明了该算法的可用性和良好的可扩展性。2.针对文本生成过程中,生成的文本内容与输入的数据存在上下文语义主题不一致的问题,本文基于条件变分自编码器(CVAE)设计实现了一种融合主题模型的文本生成方法(Trans CVAE),通过主题建模方法在线捕获生成数据的上下文主题信息,获得文本数据对应的主题编码。将CVAE中的条件信息设置为文本数据对应的主题编码,使文本生成过程添加了主题约束。最后在数据集上进行了3组实验并证明了此方法的BLEU值最优,更加符合人类的逻辑,且倾向生成长文本。针对以上两个研究内容,本文分别提出了面向大规模文本在线主题建模的动态建模方法(Dist HDP)和融合主题模型的文本生成方法(Trans CVAE)。最后在多个数据集上分别验证了两个模型,实验表明,Dist HDP比单机版本算法的训练速度快,尤其在处理大规模数据集时尤为明显。同时,并行主题模型Dist HDP的线程数扩展至30时,其并行效率仍保持70%以上,体现了其良好的扩展性。对于Trans CVAE,在蕴含数据集上,该模型的BLEU值达到了最大。另外,Trans CVAE更加倾向生成较长的文本序列,比Transformer模型的平均生成文本长度多50%。
其他文献
基于非线性频率上转换的红外成像技术,是利用激光与物质相互作用实现频率变换的方法,将低频红外图像等信息转换到近红外或者可见光波段,再通过高性能的近红外或可见光相机对转换信息进行探测,可以间接实现低频红外图像信息的探测。相比于传统的高成本红外成像相机,基于非线性频率上转换的红外成像技术具有高速响应且无需冷却、固有噪声低等特点,具有很好的研究前景,而且随着激光技术的发展和非线性晶体材料研究的进步,非线性
光场相机是一种在图像传感器前加入微透镜阵列的新型相机结构,不但能够捕捉空间光线位置信息,还能够捕捉光线方向信息。这一特殊的光学结构,决定了其异于传统相机的新颖功能,例如全聚焦成像、重聚焦成像、多视角成像、合成孔径成像、去湍流成像、深度估计、波前探测等。对于微距、近景、中景等不同的应用场景,如何突破传统光场相机的结构限制,设计出满足分辨率要求的最佳参数组合,并计算具有真实量纲的点云数据,是本文的研究
复杂网络,即是复杂系统的一种抽象形式。它将系统中的个体和关联抽象为网络中的节点和链路。在复杂网络的应用中,有一项很重要的就是链路预测,即预测网络中存在的但未被发现的关联或者预测网络中未来可能存在的关系。在链路预测中,通常会利用网络节点的属性以及网络的结构。然而,现实生活中的网络中往往有很多噪声信息,从而干扰我们对网络未知链路的预测,因此研究网络噪声对链路预测的影响,即网络链路预测的鲁棒性成为了我们
同步定位与建图(Simultaneous localization and mapping,SLAM)技术对于无人机在无导航信息的未知环境中执行任务有着至关重要的作用。多架无人机相互配合,共同完成SLAM可以获得更快的建图速度和更高精度的定位结果,在军用和民用领域都具有广阔的应用前景。本文以搭载激光雷达的旋翼无人机为研究对象,对多无人机协同SLAM技术展开研究。首先,对多机SLAM的基础:单无人机
2018年,美国兰德公司、战略与预算评估中心等多家智库不约而同地推出“政治战”研究报告,认为美国在现代战争方面存在根本性缺陷,单一的军事手段已无法满足维护其国家利益的需要,应改变对于传统军事战争的依赖,积极发展21世纪“政治战”(Political Warfare)能力。他们积极鼓动特朗普政府重拾冷战工具,对中俄等国发动“政治战”的背后,折射的是美国基于对中俄等国家快速崛起,挑战其全球霸权地位引发
随着信息时代的迅猛发展,软件开发活动逐渐在越来越多的企业中扮演着更加重要的角色,为了将开发人员从复杂繁重的工作中解放出来,使得他们能够有更多时间进行软件高层设计,而不必要将时间都浪费在程序的实现细节上,研究人员做了大量研究工作在程序合成领域上。程序合成旨在能够围绕用户意图生成出符合需求的代码,以辅助程序员的开发工作,程序合成也成为软件工程未来研究的重要方向之一。目前程序合成领域面临着一些严苛的挑战
部队训管结合是一个老话题,却是一个新课题。一方面,不同时期的训和管有着不同的内涵、外延及相应业务工作,影响着训管结合的内容变化;另一方面,不同时期的军队面临不同的发展背景、形势、任务和目标,使训管结合所能实现的程度、效果和目标等方面要求有较大变化。当前,我国发展进入新时代,改革强军踏入新征程,军委机关层面成立训练管理部释放了上层抓训管结合的信号和决心,也表明了当前的训管结合现状已不适应军队建设发展
目标检测识别技术一直是计算机视觉领域中的重点研究方向,在民用领域主要的应用包括自动驾驶、人脸识别、智能交通等,在军事领域主要的应用则体现在光电侦察、监视、告警和精确制导等方面。本文主要研究复杂背景下地面可移动目标的检测识别问题,重点关注坦克、装甲车、特种运输车等有可能改变位置和姿态的时敏目标。此类目标具有目标小而多、目标类型多样、背景复杂和样本稀少的特点。为了解决这些难题,本文提出利用视觉显著性理
海洋具有丰富的物质资源,是各国经济和军事发展所必须的战略领域。水下传感器网络、海底光缆、水下机器人、水下无人潜航器(AUV)、蛙人等平台之间的通信需要更高的传输速率以及更高的可靠性。电磁波应用于水下,具有信息速率高、抗干扰能力强、截获概率低的特点。但是由于水介质的固有特性,导致水下电磁波通信面临一定困难,因此进行水下电磁波通信系统设计时急需解决的问题。本文从数学计算和仿真两方面进行了研究,使得水下
近些年来,随着智能移动终端的广泛普及,在线社交网络已经成为人们日常生活中不可缺少的一部分。人们通过在线社交网络浏览感兴趣的信息,并与兴趣相投的各种人交友,这些行为都是对用户兴趣爱好和性格特点等的刻画。通过收集这些信息可以实现对特定用户及其社交关系的画像,从而为人物分析等应用提供支撑。但对于公众人物,他们不仅出现在在线社交网络中,在公众的新闻媒体中也包含有与其相关的大量资料和相关人物,这些构成了他们