基于大规模网络数据的图像分类技术研究

来源 :南开大学 | 被引量 : 0次 | 上传用户：chance_abc

【摘要】

：

大规模网络数据的利用可以有效地解决深度神经网络训练过程中面临的数据匮乏问题,已受到研究者的广泛关注。但是,直接爬取的网络数据存在大量噪声,因此,现有的多数相关工作均

【作者】

：

孙晓晓

【出处】

：

南开大学

【发表日期】

：

2004年期

【关键词】

：

网络数据图像分类卷积神经网络迭代过滤无监督物体检测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

大规模网络数据的利用可以有效地解决深度神经网络训练过程中面临的数据匮乏问题,已受到研究者的广泛关注。但是,直接爬取的网络数据存在大量噪声,因此,现有的多数相关工作均致力于减少噪声数据影响。这些工作通常使用在标准数据集上训练的基础模型辨别噪声数据,但这样的做法存在以下两点局限:一方面,基础模型由于数据量的不足通常未经过充分训练,所以模型的预测结果并不可靠;另一方面,网络数据与标准数据的分布存在差异,而基于标准数据训练的模型仅能对同分布的数据做出有效区分,因此,现有做法会错误地删除部分有用的图像。为了解决基础模型数据量不足的问题,本文提出在迭代过滤网络噪声数据的同时微调卷积神经网络模型。在二者的迭代交互及更新过程中,本文方法既可以获得学习能力增长的模型来更正网络图像的标签,又可以获取新的有效数据来训练模型。首先,本文通过渐进式的迭代更新,提高了模型对网络图像的判别能力,使得对噪声图像的识别更加准确,进而随着模型的改进逐步选择高质量的网络图像来扩大训练集。其次,由于网络图像内容的复杂性,单个标签有时并不能准确地描述一幅图像,因此,本文提出了为每幅网络图像分配多个标签的修正策略,来减少硬标签分配对模型带来的限制。为了缓解网络数据和标准数据的分布差异,本文提出了一种无监督物体检测的方法对网络图像进行处理,同时设计了两个准则来约束处理后图像中物体的数目、位置和类别。继而,根据约束后的物体检测结果,本文进一步通过图像级别的处理拉近网络数据与标准数据的距离,从而提升了网络数据的利用效率。在实验部分,本文爬取约50万幅网络图像,覆盖了三个公共图像分类数据集的全部类别,并利用搜集的网络图像辅助三个不同的分类任务。实验结果均表明本文提出的方法可以显著地提升图像分类模型的性能,同时优于其他相关工作。

其他文献

跨城市道路桥梁钢箱梁施工技术要点

现代交通产业在随着经济的快速发展也不断提升着发展需求,城市的道路桥梁建设工作也逐渐变得复杂化、多元化。钢箱梁施工技术是在跨城市道路桥梁建设中较为常见的一种结构形

期刊

城市道路桥梁钢箱梁施工技术技术要点

婴幼儿重症肺炎72例临床分析

婴幼儿重症肺炎是住院患儿中常见的急重症之一，是严重威胁3岁以下小儿生命的疾病。如何降低婴幼儿重症肺炎的病死率，是儿科医生研究的课题之一。本院2001年5月-2006年12月收治7

期刊

婴幼儿重症肺炎

胆源性胰腺炎早期非手术治疗的可行性

目的探讨不同程度胆道梗阻及急性胰腺炎早期非手术治疗方法的可行性。方法对近5a我院收治的轻症非梗阻型、轻症梗阻型、重症非梗阻型及重症梗阻型胆源性胰腺炎患者的临床治疗

期刊

胆源性胰腺炎非手术治疗早期

经鼻内镜下鼻甲等离子消融术的配合

等离子体手术系统是一种应用了专利的低温等离子消融术，它是利用低温等离子射频的能量使组织体积缩小或行组织切除的外科技术。该系统将手术的安全性、可控性与功能性提高至新

期刊

鼻内镜射频下鼻甲肥大手术配合

萍乡肉红鲫食性与生长研究

萍乡肉红鲫主要分布于萍乡市境内的自然水体,在当地有悠久的养殖历史,为该地区传统的养殖品种.萍乡肉红鲫栖息于水体的下层,属杂食性鱼类.经检测:食物种类随体长的变化而改变

期刊

萍乡肉红鲫食性生长研究

我国产学研合作研究态势的文献计量学分析

产学研合作作为合作创新的重要方式,为整合资源、优化产业与发展经济作出了重要贡献。为了掌握我国产学研合作的研究情况,运用ucinet6.0等软件对1993年到2019年的2561篇北大

期刊

产学研合作研究计量学分析社会网络分析展望

基于大规模网络数据的图像分类技术研究

其他学术论文