基于大规模网络数据的图像分类技术研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:chance_abc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模网络数据的利用可以有效地解决深度神经网络训练过程中面临的数据匮乏问题,已受到研究者的广泛关注。但是,直接爬取的网络数据存在大量噪声,因此,现有的多数相关工作均致力于减少噪声数据影响。这些工作通常使用在标准数据集上训练的基础模型辨别噪声数据,但这样的做法存在以下两点局限:一方面,基础模型由于数据量的不足通常未经过充分训练,所以模型的预测结果并不可靠;另一方面,网络数据与标准数据的分布存在差异,而基于标准数据训练的模型仅能对同分布的数据做出有效区分,因此,现有做法会错误地删除部分有用的图像。为了解决基础模型数据量不足的问题,本文提出在迭代过滤网络噪声数据的同时微调卷积神经网络模型。在二者的迭代交互及更新过程中,本文方法既可以获得学习能力增长的模型来更正网络图像的标签,又可以获取新的有效数据来训练模型。首先,本文通过渐进式的迭代更新,提高了模型对网络图像的判别能力,使得对噪声图像的识别更加准确,进而随着模型的改进逐步选择高质量的网络图像来扩大训练集。其次,由于网络图像内容的复杂性,单个标签有时并不能准确地描述一幅图像,因此,本文提出了为每幅网络图像分配多个标签的修正策略,来减少硬标签分配对模型带来的限制。为了缓解网络数据和标准数据的分布差异,本文提出了一种无监督物体检测的方法对网络图像进行处理,同时设计了两个准则来约束处理后图像中物体的数目、位置和类别。继而,根据约束后的物体检测结果,本文进一步通过图像级别的处理拉近网络数据与标准数据的距离,从而提升了网络数据的利用效率。在实验部分,本文爬取约50万幅网络图像,覆盖了三个公共图像分类数据集的全部类别,并利用搜集的网络图像辅助三个不同的分类任务。实验结果均表明本文提出的方法可以显著地提升图像分类模型的性能,同时优于其他相关工作。
其他文献
笔者走访了汶上县池塘养鱼连年高产的几位专业户,他们的高产鱼塘中后期管理经验如下。 高产成鱼塘的中后期管理是指夏、秋两季鱼塘的管理,可概括为:一巡、二调、三防、四定
乌鳢肉味鲜美、营养丰富,能生肌补血、滋补身体,有很高的药用价值.特别在当前水库养殖中风行混养少量乌鳢,既可清除水中野杂鱼、又可提高养鱼经济效益.目前乌鳢养殖的苗种来
现代交通产业在随着经济的快速发展也不断提升着发展需求,城市的道路桥梁建设工作也逐渐变得复杂化、多元化。钢箱梁施工技术是在跨城市道路桥梁建设中较为常见的一种结构形
婴幼儿重症肺炎是住院患儿中常见的急重症之一,是严重威胁3岁以下小儿生命的疾病。如何降低婴幼儿重症肺炎的病死率,是儿科医生研究的课题之一。本院2001年5月-2006年12月收治7
目的探讨不同程度胆道梗阻及急性胰腺炎早期非手术治疗方法的可行性。方法对近5a我院收治的轻症非梗阻型、轻症梗阻型、重症非梗阻型及重症梗阻型胆源性胰腺炎患者的临床治疗
等离子体手术系统是一种应用了专利的低温等离子消融术,它是利用低温等离子射频的能量使组织体积缩小或行组织切除的外科技术。该系统将手术的安全性、可控性与功能性提高至新
商品虾饲养是南美白对虾养殖的主要目的.为推广南美白对虾养殖及其养殖技术,提高养殖水平和经济效益,促进经济可持续发展,特制定本标准(试行).
期刊
萍乡肉红鲫主要分布于萍乡市境内的自然水体,在当地有悠久的养殖历史,为该地区传统的养殖品种.萍乡肉红鲫栖息于水体的下层,属杂食性鱼类.经检测:食物种类随体长的变化而改变
产学研合作作为合作创新的重要方式,为整合资源、优化产业与发展经济作出了重要贡献。为了掌握我国产学研合作的研究情况,运用ucinet6.0等软件对1993年到2019年的2561篇北大
<正> 随着集约化养殖程度的提高,一些常见细菌性病害变得流行和顽固起来,过去施之有效的办法往往效果不佳,甚至以往所谓的敏感药物也治疗无效。这就要求养殖者加深对细菌性病