结合场景描述的文本生成图像方法

来源 :激光与光电子学进展 | 被引量 : 1次 | 上传用户:xingyuan77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究基于场景描述文本生成对应图像的方法,针对生成图像常常出现的对象重叠和缺失问题,提出了一种结合场景描述的生成对抗网络模型。首先,利用掩模生成网络对数据集进行预处理,为数据集中的对象提供分割掩模向量。然后,将生成的对象分割掩模向量作为约束,通过描述文本训练布局预测网络,得到各个对象在场景布局中的具体位置和大小,并将结果送入到级联细化网络模型,完成图像的生成。最后,将场景布局与图像共同引入到布局鉴别器中,弥合场景布局与图像之间的差距,得到更加真实的场景布局。实验结果表明,所提模型能够生成与文本描述更匹
其他文献
血迹作为暴力案件现场出现率较高的生物检材,其检验鉴定工作可为案件的快速侦破提供大量信息。高光谱成像技术可对案发现场的血迹检材进行无损、快速成像,相比于检测血迹的化学试剂法和传统的光谱分析方法,高光谱成像技术具有图谱合一的显著优势。在简要分析高光谱成像特点、数据表达方式和数据处理方法的基础上,介绍了高光谱成像技术在国防、生态、食品等领域的应用,重点研究了高光谱成像技术作为血迹检测的一种技术手段在潜在
针对传统图像拼接方法处理速度慢、效率低、无法满足高分辨率图像快速准确拼接的需要,提出一种基于ORB特征的高分辨率图像拼接改进算法。首先在ORB特征点提取的基础上,采用汉明距离进行快速粗匹配;然后基于渐进采样一致性(PROSAC)算法对匹配点对进行优化,去除误匹配点对之后,求解图像变换矩阵;最后采用渐入渐出加权融合算法对图像重叠区域进行融合,去除拼接痕迹。实验结果表明,相较于传统算法,本文算法不仅在
运用录像观察、数理统计、新三段指标评估等研究方法,对第54、55届世乒赛女双项目进入决赛、半决赛的弧快型打法配对、快弧型打法配对和削攻型打法配对的技战术进行分析。结果表明:弧快型打法配对发球变化多端、抢攻质量高,但与第5板的衔接慢,接抢及连续进攻意识被动且失误较多;快弧型打法配对发抢意识明显且杀伤力大,发球质量低且同伴第3板被动接球与第5板衔接不流畅,接抢意识被动,攻防转换较慢;削攻型打法配对发球“倒板”直接得分能力强,但抢攻和防守稳定性差,接发球抢攻意识弱,相持中削球及反攻的稳定性不高。旨在为不同类型打
针对现有药房药剂师取药任务繁重、效率低下等问题,设计了基于机器视觉的取药机器人系统,提出了一种基于融合局部特征匹配和Mean Shift算法的药品识别算法,系统整体实现了药品的识别、定位及抓取任务。首先,安装于药架之间的抓药机器人接收上位机发送的药品信息,通过摄像头识别药品,使用AKAZE算法对货架上的药品进行匹配,获取药品坐标后,将匹配的药品抓取放至传送带上;位于取药处的分拣机器人得到上位机发送
针对现有基于像素损失的超分辨率图像重建算法对纹理等高频细节的重建效果差问题,提出了一种基于改进超分辨率生成对抗网络(SRGAN)的图像重建算法。首先,去除了生成器中的批归一化层,并结合多级残差网络和密集连接,用残差套残差密集块提高了网络提取特征的能力。然后,结合均方误差与感知损失作为指导生成器训练的损失函数,既保留了图像的高频细节,又避免了伪影的出现。最后,去除了判别器的最后一层Sigmoid层,