【摘 要】
:
文本到图像生成是图像生成领域重要的一个研究方向,目的是将文本中描述的语义关系,运用图像生成技术还原并生成语义相关的图像。随着生成对抗网络的兴起和快速发展,文本到图像生成技术被提出并不断突破,同时也成为了机器视觉、人工智能领域的研究热点之一。文本到图像生成模型的性能很大程度依赖于生成对抗网络中生成器和判别器的好坏,本文针对生成对抗网络普遍存在模式崩溃引发的生成样本多样性不足等问题,在基于堆叠式文本到
论文部分内容阅读
文本到图像生成是图像生成领域重要的一个研究方向,目的是将文本中描述的语义关系,运用图像生成技术还原并生成语义相关的图像。随着生成对抗网络的兴起和快速发展,文本到图像生成技术被提出并不断突破,同时也成为了机器视觉、人工智能领域的研究热点之一。文本到图像生成模型的性能很大程度依赖于生成对抗网络中生成器和判别器的好坏,本文针对生成对抗网络普遍存在模式崩溃引发的生成样本多样性不足等问题,在基于堆叠式文本到图像生成模型的基础上,引入互信息及皮尔逊相关系数等条件约束生成器和判别器,提出结合互信息最大化的文本到图像生成方法和结合皮尔逊重构的文本到图像生成方法,主要研究成果如下。1.针对文本到图像生成模型生成样本分布不均匀导致多样性不足的问题,提出了一种结合局部-全局互信息最大化的堆叠式文本到图像的生成对抗网络模型。首先利用生成模型将全局向量解耦得到不同尺度特征图;然后,通过最大化特征图与全局向量间的互信息,对图像全局特征与文本描述的相关性进行增强;最后,将特征图提取为局部位置特征向量,通过最大化局部位置特征向量与全局向量之间的平均互信息,加强局部位置特征与文本描述的相关性,得到更紧密的文本到图像的映射关系。通过实验分析和结果表明,该方法能有效提高生成样本的多样性和语义精确度。2.针对生成对抗网络中判别器收敛过快而无法为生成器提供梯度导致生成样本多样性和图像质量难以提升的问题,提出了一种结合最大化皮尔逊相关系数的文本到图像生成模型。该模型改进了判别器,令判别器能同时判别和编码,为模型提供了推理模型的同时限制判别器的判别能力,增强了判别器的泛化性能,使判别器和生成器的训练更容易达到纳什平衡。另外为了增强多尺度图像编码的一致性,提出了多尺度联合损失,令各尺度特征向量以输入组合向量为重构目标,建立一致的重构目标。通过实验分析和理论证明,该方法有效提高了生成样本的多样性和表述质量,另外插值实验表明,重构可以生成整体轮廓和风格与生成样本一致的图像,表明判别器改进的编码器能生成有效的特征向量。
其他文献
为了深入研究沥青的疲劳机理,解决现有沥青疲劳机理中没有考虑触变性的影响这一关键问题,对4种沥青进行了稳态剪切试验、疲劳试验和愈合试验。根据试验结果建立了沥青的触变
米枣为鼠李科枣属植物,主要产区为四川省三台县。米枣口感酸甜脆嫩,营养价值高、外观优美且带有区域特色的水果,深受喜爱。由于鲜枣不能满足市场需求,加之对米枣加工工艺研究
个人消费信贷正在逐渐成为我国银行业发展的一个新的利润增长点。然而,目前商业银行个人消费信贷的发展却不够理想,消费贷款在商业银行的贷款业务中所占比重较小,与国内发达
自动洗车是近年来为小型乘用车的清洗而兴起的一个新兴服务业。它具有进入门槛较低、投资小、见效快、风险较低的特点。文章通过对公司红光加油站引进该项目进行了市场、竞争
目的:对比分析氯胺酮和异丙酚用于麻醉诱导的临床疗效.方法:选取在某院就诊的88例择期腹部手术老年患者进行研究,随机选取44例作为观察组,行氯胺酮诱导麻醉;另44例患者作为对照
基于中美两国产品生产成本和单位产品碳排放量均不同的事实,以美国仅实施碳税政策的两阶段博弈模型为基准,引入美国政府对从中国进口产品开征碳关税是由于中国政府未实施环境
传统交叉效率评价方法因决策单元偏好权重不唯一而难以操作,因交叉效率有效性分值平均化集结而难以被接受。目前的学者通常围绕决策单元指标权重的确定性分配方法、交叉效率
建立用示差折光高效液相色谱法测定复方胃蛋白酶颗粒中葡萄糖、蔗糖、麦芽糖含量的方法。选用色谱柱为Sugar-D,流动相为乙腈-水(78:22,V/V),流速为1.0mL/min,在室温条件下进
目的探讨云南白药胶囊对股骨转子间骨折患者术后疼痛肿胀的临床效果。方法选取该院2014年1月至2016年1月收治的101例股骨转子间骨折患者,将患者按数表法随机分为2组,分别为观
目的探讨云南白药胶囊联合气雾剂治疗头皮血肿的疗效。方法随机分成对照组、试验组1和试验组2。对照组给予常规治疗和护理;试验组1在对照组基础上给予云南白药胶囊;而试验组2