【摘 要】
:
序列到序列(seq2seq)方法在开放域对话生成领域中备受研究学者的关注.然而,标准的序列到序列模型容易产生语义冲突和不连贯的对话回复,这种不一致性是现有系统生成的回复显著有别于人类真实对话的重要原因之一.对话生成中的一致性既包括回复内部的语义一致性,也包括上文与其回复之间的外部关联性.本文提出了一个新的对话生成框架,称为基于张量匹配的生成式对抗网络(MatchGAN),以提高对话回复与其上文之间的外部关联性.与传统的基于最大似然估计的方法不同,该框架通过基于序列到序列模型的生成器和基于张量匹配网络的判别
【机 构】
:
中国科学院计算技术研究所 北京100190;中国科学院大学 北京100049;中国科学院计算技术研究所 北京100190
论文部分内容阅读
序列到序列(seq2seq)方法在开放域对话生成领域中备受研究学者的关注.然而,标准的序列到序列模型容易产生语义冲突和不连贯的对话回复,这种不一致性是现有系统生成的回复显著有别于人类真实对话的重要原因之一.对话生成中的一致性既包括回复内部的语义一致性,也包括上文与其回复之间的外部关联性.本文提出了一个新的对话生成框架,称为基于张量匹配的生成式对抗网络(MatchGAN),以提高对话回复与其上文之间的外部关联性.与传统的基于最大似然估计的方法不同,该框架通过基于序列到序列模型的生成器和基于张量匹配网络的判别器之间的对抗学习来生成与上文相关的回复.通过使用匹配网络对上文与回复之间的多维关系进行建模,该模型所产生的回复更加符合人类对话的特点.此外,本研究进一步引入了目标侧注意力机制来增强所产生回复的内部语义一致性.实验结果表明,本文提出的框架能够产生高质量的对话回复,在量化指标评价和人工评测方面均优于其他基线方法.
其他文献
自幼喜爱地理的屠思聪,在上海苦心经营世界舆地学社,其所编绘的《中华新形势一览图》《中华最新形势图》等图集,既是珍贵的近代历史资料,也是生动的爱国主义教材.rn20世纪20年代以后,上海陆续有多家专营地图出版的民营舆图学社成立,其中尤以屠思聪创办的世界舆地学社,洪懋熙创办的东方舆地学社,陈铎创办的上海舆地学社,以及金氏兄弟(金振宇、金纬宇、金擎宇)创办的亚光舆地学社四家机构最有名望,号称当时上海的四大舆地学社.
建于2005年的中科院珠穆朗玛大气与环境综合观测研究站,是我国位于喜马拉雅山北麓珠峰地区海拔4000米以上的唯一野外科学观测研究站,为泛“第三极”地区相关科学研究和地方经济社会发展规划等提供数据支持,为青藏高原多学科科考提供了强大支撑.
利用时相为2001年的美国陆地卫星Landsat ETM+影像,在福建开展1 ∶ 5万遥感地质解译及异常信息提取,再配合野外地质解译成果验证及异常信息查证,并结合物探、化探、水系重砂等已有成果资料,通过1∶5万洪洋、丹阳幅区域地质调查在922 km2范围内圈出9处成矿远景区,为该区域进一步找矿提供了新的线索.
以福建沿海主要河流九龙江河口为例,基于九龙江河口北港厦漳跨海大桥北段东侧海域钻孔(ZKH3),并结合九龙江河口以往有关钻孔资料,应用层序地层和年代地层学对比方法,对钻孔所揭露的沉积地层,以岩石地层为基础,依据其地层岩性、岩相特征、沉积环境,配合AMS(Accelerator Mass Spectrometry,加速器质谱测年技术)14C、光释光(OSL)测年等数据,对研究区第四纪地层进行综合划分对比,并初步分析探讨福建九龙江河口地区第四纪地层的沉积特征.从钻孔揭露地层来看,九龙江河口地区基岩以上的松散堆积
特征点匹配是遥感图像配准中的重要环节,但传统的特征点匹配方法存在同名点一对多或者匹配的同名点定位不准确的问题,进而影响匹配精度.针对此问题,在归一化重心坐标系NBCS匹配算法的基础上,在已完成的NBCS特征匹配后进行迭代计算剔除误差过大的同名点对和选择邻域定位更为准确的特征点,经图像特征匹配实验验证,改进算法实现了特征点的准确匹配,提高了匹配精度.
东天山—北山地区是中国重要的金属成矿带,对于其晚二叠世—中三叠世构造演化的认识,仍存在较大分歧.东天山东段国宝山地区出露有一系列晚二叠世—中三叠世花岗质岩石,包括花岗闪长岩、二长花岗岩、石英正长岩、正长花岗岩和天河石花岗岩.该系列岩体整体以富硅、富碱为特征,其中花岗闪长岩、二长花岗岩和石英正长岩具有钾质和富镁特征,轻稀土相对重稀土更富集(LREE/HREE=0.86),稀土配分曲线整体右倾,呈弱Eu负异常(δEu=0.40~0.68);而正长花岗岩与天河石花岗岩类似,具钠质和铁质特征,富集Ta、Rb,重稀
氰化尾渣是黄金在冶炼过程中通过氰化浸出工艺所产生的的固体废渣,具有较大综合利用价值.根据氰化尾渣的特点,评述了从氰化尾渣中回收金的工艺方法及其主要优缺点.最后指出,各类氰化尾渣均可根据各自矿物组合及其细粒度特点,通过科学的环保与技术经济评价,选择合理的适合自身特点的金回收工艺.
基于GIS平台及其水文模块,利用流域划分的原理,对DEM进行预处理,提取了福建区域内的子流域分布,结合省内重要人口聚集地、交通干线、水系干流、海岸线等地理要素空间分析,对省内一重山范围进行提取研究,基于GIS三维视角及野外验证,提取的一重山范围效果较好,表明该技术方法可行,在一定程度上可以解决目前要实施的国土空间规划、山水林田湖草整治、海岸线环境评价、矿山环境治理、生态敏感性评价、流域生态环境治理、生态景观提升工程等专题研究,对一重山范围划分问题,并为相关技术提供参考.
为了预防煤矿水害事故的发生,本文提出将经验模态分解(EMD)算法与时序注意力机制(TA-LSTM)结合的明渠流量预测模型,通过对明渠流量的实时预测来反映矿井涌水量的变化情况.模型首先通过EMD将明渠流量分解为多维子分量,充分提取明渠流量本身的波动特征和趋势特征;然后以长短时记忆网络(LSTM)为基础,融入注意力机制增强历史时间点对当前时刻的信息表达,构造时序注意力机制模型;最后通过该模型分别训练学习EMD分解后各分量的时序规律并进行预测,将各分量预测结果融合得到最终的明渠流量预测值.将此模型与现有其他模型
卤族元素氟、氯、溴、碘广泛分布在地圈、水圈和生物圈,它们是矿产资源,也是许多地学研究的信息载体,更与人类生活紧密相关.卤族元素分析是地质分析的重要组成部分,而X射线荧光光谱分析方法在当今的卤族元素分析中占有重要地位.本文收集我国1988年—2020年间X射线荧光光谱分析地质材料氟、氯、溴、碘的文献126篇,在简述卤族元素的天然存在、分析技术、X射线谱学特点及现代X射线荧光光谱仪器条件的基础上,分类评介了X射线荧光光谱在氟、氯、溴、碘分析中的应用.样品类型包括:作为主组分的卤化物矿石矿物,作为次量和痕量组分