【摘 要】
:
卡通人脸生成在孤独症儿童干预以及短视频等领域有着广泛的应用。虽然基于卷积神经网络以及生成对抗网络的方法在卡通人脸生成方面取得了巨大的成就,但是经过卡通风格图像生成网络生成的卡通人脸仍然保留着自然风格而非卡通风格应有的纹理信息,比如自然风格人脸图像中的头发部分经过卡通风格图像生成网络后依然保留对应自然风格图像大量的纹理信息。因此,为了减小卡通风格图像生成网络生成的卡通人脸与手工创作卡通风格图像之间的
论文部分内容阅读
卡通人脸生成在孤独症儿童干预以及短视频等领域有着广泛的应用。虽然基于卷积神经网络以及生成对抗网络的方法在卡通人脸生成方面取得了巨大的成就,但是经过卡通风格图像生成网络生成的卡通人脸仍然保留着自然风格而非卡通风格应有的纹理信息,比如自然风格人脸图像中的头发部分经过卡通风格图像生成网络后依然保留对应自然风格图像大量的纹理信息。因此,为了减小卡通风格图像生成网络生成的卡通人脸与手工创作卡通风格图像之间的差距,本文将图像熵融入到了卡通风格图像生成对抗网络中,并将其应用到基于卡通游戏的孤独症儿童干预系统之中。本文的主要内容和贡献如下:(1)通过对人脸自然图像和卡通图像的观察和统计,本文提出了人脸图像在卡通风格下的图像熵低于其在自然风格下的图像熵这一假设。针对该假设,本文提出了一种图像熵的计算方法,该方法规避了现有计算方法无法统计图像的空间特征和未考虑图像颜色通道间关联的缺点。在此基础上,本文计算了公共数据集中人脸图像在不同颜色空间下的自然图像以及对应卡通图像的图像熵;同时,为了充分利用人脸图像各区域的特征,本文还对人脸图像中诸如头发、眼睛、眉毛等各区域的图像熵进行了计算。实验结果证明,对于同一张人脸图像的自然风格与卡通风格而言,自然风格下的全局图像熵与其脸部各区域的图像熵也更高,符合预期的假设。本实验也发现图像熵可以用来对图像的整体结构以及某一区域的混乱程度进行约束。(2)本文提出了融合图像熵和生成对抗网络的卡通人脸生成算法IeGAN(Image entropy Generative Adversarial Network)。首先本文对卡通效果逼真的图像进行图像熵的计算,并将其作为经验值输入到IeGAN的生成器以及判别器中,而后训练IeGAN使其生成的卡通图像更加趋向于卡通效果逼真的图像。实验结果证明,融合图像熵和生成对抗网络后,生成的卡通图像更加符合人类对卡通风格图像的视觉认知。与其他卡通风格图像生成算法对比,本文所提出的IeGAN能够更好地将自然图像下的纹理信息转换到生成的卡通图像之中。(3)本文将提出的IeGAN算法应用到儿童孤独症干预领域,并设计了一个基于卡通游戏的儿童孤独症干预系统。为了使得生成的儿童卡通人脸更加逼真,本文通过收集和制作儿童人脸数据来对数据集进行扩充,随后利用成人数据集领域与儿童数据集领域相似的特征来对IeGAN进行迁移训练。此外,干预系统将孤独症儿童映射到数字世界中,并通过预先在本文儿童数据集训练好的IeGAN生成孤独症儿童自己的卡通人脸,将其应用于卡通游戏来对其进行干预。
其他文献
城市书房是一种小型实体图书馆,从温州在2014年建起第一座城市书房起,以其便捷、舒适、休闲等特点迅速风靡全国,至今已有超过150个城市建立起超过1800座城市书房。城市书房的出现,极大丰富了我国群众精神文化生活,有效推动全民阅读活动的深入。城市书房大多是由当地政府文化部门主管,市公共图书馆负责业务指导、资源支持、监督考核等工作,并积极引入社会力量参与建设。随着城市书房数量增加,其服务质量也显得愈发
在经济快速发展的今天,文化发展已成为促进经济发展和实现中华民族伟大复兴的必由之路。民族古籍作为展现民族文化的重要途径,对其进行必要的保护、研究具有重要意义。云南省是我国世居少数民族种类最多的省份,民族文化资源丰富,历史长河中形成的民族古籍亦是汗牛充栋。但近年来,民族古籍保护形势却不容乐观,每年有大量的古籍与古籍传承人在消失,为了保护民族文化,急需改善这种情形。随着近年来数字化技术的发展,民族古籍数
自新冠疫情爆发之后,学生及教师们响应“停课不停学”的号召,均开始采用线上线下相结合的方式来进行教学,线上教学的重要程度显得愈发强烈。线上教学相比传统的教学方式有着一些明显的优点,如不受时间与空间的约束、教学资源可反复观看学习、可快速收集学习者学习数据等,但在在线教学的场景之中,教师却无法及时判断学习者的学习情况,从而动态调整自己的教学计划,实现因材施教与个性化教学的目标,但值得庆幸的是,随着人工智
图书馆员是我国公共图书馆组成的核心部分,是图书馆业务开展的实施者和指导者。馆员的职业认同度对图书馆的发展至关重要。为了客观把握我国图书馆员职业认同的现状,探析馆员职业认同的深层原因以及职业认同与职业发展之间的联系,本研究结合社会认同理论、综合激励理论,对我国公共图书馆员职业认同展开翔实的研究。本文在文献综述的基础上,构建公共图书馆员职业认同结构模型,编制《我国公共图书馆员职业认同》调查问卷,对我国
面部表情识别对于机器解析人的状态和行为至关重要,在机器人研发、心理营销学、人机交互、教育、安全等诸多领域中有难以替代的应用价值。虽然自然场景下的面部表情识别依靠深度学习模型强大的对于海量数据的学习和表示能力取得了长足进步。但是,在收集大规模面部表情数据集时,不可避免地会产生一些来自图像数据本身、错误标签或表情固有混淆性的噪声,并导致模型退化。为了缓解这个问题,本文研究了基于标签置信估计和多网络联合
卫生监督是中国卫生健康系统的重要组成部分,其成立的宗旨在于在保障卫生健康领域相关工作的合法性和安全性,促进人民健康可持续发展和全国经济社会的快速发展。自2019年以来,全国各地机构改革不断深入,监督范围、专业急剧扩大,卫生监督面临着新的要求和更大的挑战,然而在卫生监督中依然存在一些迫切需要解决的问题,如卫生监督体制机制仍待完善、资金支撑乏力、卫生监督资源分布不合理等。在本篇论文中,将通过发放问卷,
随着教育改革的不断推进,教学评价改革也受到了越来越多的关注。传统的教学评价往往以教学成果作为主要的评判依据。然而对于教学评价而言,教学过程评价应当与教学成果评价同等重要。学生在课堂中的专注度可视为是注意力集中程度、学习参与状况等的综合体现。因此学生课堂的专注度可为教学过程评价提供数据支撑,对教学评价改革具有十分重要的意义。现有的学生专注度识别法可分为手动识别和自动识别。手动识别耗时费力,且结果的有
十三五以来,在国家的大力扶持下新材料产业发展充满动能,云南省深抓新材料产业发展的契机,着力打造“楚雄-中国绿色新钛谷”。在此背景下,本文将产业竞争情报理论与区域重点产业发展结合,立足云南省八大重点产业之一的新材料产业,具体以钛合金材料产业作为研究对象开展产业竞争情报分析。通过对钛合金材料产业国内外现状、云南省钛合金材料产业创新发展情况、产业链环境、外部竞争环境等展开深入分析,剖析得到云南省钛合金材
蒙医诊法是根据“内病必外现”、“脏腑虽居内,其花却开于外”、“整体之病,证形于局部;局部之病,牵涉整体”的原则总结出来的,从外察内、从局部知整体、从个别求普遍、从特殊到一般的一套辨证的诊断方法,与全息观点完全一致,是受全息律排布和制约的结果。蒙医诊断方法的原理是全息思想的体现,全息思想是蒙医诊断方法的理论基础。生物全息律的发现使蒙医学诊断方法中支离破碎的内容得到了统一,而且为蒙医学的许多论述提供了
目的:探讨蒙医药治疗稳定型心绞痛的临床疗效。方法:将确诊为稳定型心绞痛的130例患者随机分为观察组、对照组,每组65例。观察组采用蒙医针刺结合内服蒙药治疗;对照组采用常规西药治疗。结果:观察组总有效率(98.46%,64/65)明显优于对照组(87.69%,57/65)(P<0.05)。结论:蒙医药治疗稳定型心绞痛疗效显著,疗程短,不良反应少,值得推广。