基于混淆图的深度模型缺陷分析与大规模图像数据集标注清洗

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:suiyuehenji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,面向图像分类的深度学习技术迅猛发展、成果显著,但是该领域的发展仍面临以下三大挑战。首先,由于深度学习的理论基础尚不坚实,人们对深度模型的容错分析困难重重。其次,当下最先进的模型复杂结构,加剧了新模型的设计和优化难度。第三,深度学习的训练严重依赖于大规模有标注数据集,而数据集中的错误标注难以避免,高质量的标注数据难以获取。面对以上三大挑战,本文提出基于无向图的“混淆图”模型,用于精确量化图像分类深度学习模型对不同图像类别的视觉混淆特性。在混淆图中利用社区发现算法提取混淆社区结构,进而辅助研究者分析模型的缺陷,理解图像分类模型的失效原因,为模型容错设计和分析做铺垫。对于ILSVRC图像分类历年竞赛杰出模型的混淆图分析证实了本文方法的有效性。不仅如此,根据混淆社区信息,本文提出“专家子网”结构,有针对性地帮助原分类模型提升图像分类精度。通过添加用于精细化分类的专家子网结构,我们将AlexNet模型的Top1平均分类错误率降低1.49%,将vgg-verydeep-16模型的Top1平均分类错误率降低3.45%。此外,我们还结合混淆社区信息和社区发现算法,提出在通用图像数据集和人脸数据集中的错误标注自动检测算法。我们清理了超大规模的MS-Celeb-1M人脸图像数据集(包含约1000万张带有错误标注的图像),并获得了一个名为C-MS-Celeb的标注基本正确的人脸数据集(包含6,464,018张94,682名明星的图像)。使用我们清洗得到的C-MS-Celeb数据集训练单网络人脸识别模型,无需微调,即可在LFW面部识别测试集上达到等错误率(Equal Error Rate)99.67%的结果,该结果与其他最先进的识别手段相当。这表明数据清理对模型训练具有显著积极影响。
其他文献
经济技术的不断进步及房屋建筑领域的不断完善,使得房产测绘工作展现出更广泛的用武之地,特别是现代房产测绘技术不仅克服了传统测绘手段中存在的弊端,更加提升了房产测绘工
从如何提高相容性和共硫化性两方面总结了近年来三元乙丙橡胶/丁腈橡胶共混胶的研究进展。
现存《文选集注》残卷存在众多脱文校补及误衍之处,本文通过对此内部证据的考察,证明残卷为誊抄本而非初编稿本,残卷对不同注家相同或相近注文的节略极可能出自誊抄者之手,其
当今社会,随着经济进程的加快,生产组织模式的改变,技术变革的加速、市场竞争的加剧、经济周期的缩短,核心企业与创新成为谋求经济发展的重要关注点。但是由于现代创新的高风
电能是各领域中的主要能源,离开电能企业无法正常生产,人们无法正常生活,人类已对电能产生了依赖性,可见保障供电可靠、稳定的重要性。继电保护是电力系统中的重要环节,是配
随着我国经济步入新常态,我国的高等教育也随之进入了以综合改革、整体提升为特征的新常态。在新常态下,高校基层党组织应深刻认识到面临的新挑战,把握机遇,积极推进高校基层
针对聚氨酯(PU)耐热性能较差的问题,简述了PU的结构与耐热性能的关系,及在PU中引入硅二醇、杂环基、扩链剂、异氰酸酯种类对耐热性能的影响。
人与人之间的沟通障碍和"人的异化"是《小镇畸人》表现的主题,也是20世纪现代文学的重要主题。《小镇畸人》里的"畸人"们生活在美国从农业社会向工业社会巨大转变的时期,在这
补充侦查是一定程度上对侦查程序的回复 ,是对已终结侦查行为缺陷的合法补救。补充侦查在实现其发现真实的主旨的同时却有侵犯人权之嫌。依照发生阶段、行为主体、启动主体以
<正> 一、绪言与过去报告过的 PET、PP 以及各种混合高分子的高速纺丝相比,尼龙6高速纺丝大多在4000米/分领域内进行。然而在这些报告中,仅限于对各纺丝速度下纤维双折射、结