基于变换域特征与深度学习的图像分类研究

被引量 : 0次 | 上传用户:cookie2189
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网高速发展的今天,图像作为视觉信息的基本表现形式,已经成为了继文本后又一描述和存储信息的常用载体,其数量正以惊人的速度增长。图像分类技术通过提取不同图像的特征,进而对图像进行分类和识别,以达到理解图像和获取图像关键信息的目的,对社会的发展以及现实的工作生活都具有极其重要的意义。本文主要研究图像分类中的视觉特征提取问题,聚焦当下前沿和热点的深度学习技术。针对现有的深度学习训练参数过多,训练过慢等问题,提出两种新的图像分类框架。与传统的深度学习直接从像素层次进行学习不同,本文框架主要利用预定义的余弦或小波滤波器组对图像进行初级的处理,捕捉图像通用的平移或旋转等刚性变换,获得原有图像在变换域上具有良好不变性和区分性的描述,避免了对多层特征提取框架中低层滤波器的学习。然后再在该频域描述之上构建深度学习网络,从数据中学习图像中未知的复杂变化源,例如目标形状、外观和混杂背景等的变化。本文的主要工作和创新点包括:1.提出了一种结合离散余弦变换和深度网络的快速目标识别算法。该方法的主要思想是使用离散余弦变换来降低输入数据的信息冗余,选择少量的低频系数输入深度网络中。然后通过非监督方法训练深度网络获得好的高层频域特征,再基于这种高层特征进行图像的分类。相关工作已整理发表在国际会议IEEE ICIP 2014上。2.针对传统的散射描述只能描述平移、尺度和线性变形等通用的图像变换,提出一种将散射变换和深度学习进行结合的框架。一方面将小波散射网络作为深度框架的前两层处理。由于散射算子的不变和稳定能力,它可以消除数据的平移或者旋转变化,而且可以把图像映射到一个规则的流形上,从而简化网络后面各层的学习。另一方面,在散射系数之上构建深度网络,可以实现从数据中学习捕捉信号中小波散射无法描述的其他复杂变化源。相关工作已整理投稿期刊。这两种框架通过使用预定义的滤波器替换深度网络中底层的滤波器,不仅避免了从数据中学习这些大量滤波器的参数,还简化了后续网络的学习。该框架相对于传统的以raw-pixel作为输入的深度学习框架,需要的训练时间和计算资源都大幅度的减少,给普通用户提供了一种应用深度学习方法的解决方案。因此,本文方法具有广泛的应用前景。
其他文献
目的:通过测定过敏反应者体内肥大细胞类糜蛋白酶、PAF和尿液中PGD2的含量,观察这些生物学指标的变化规律,比较非离子型造影剂过敏人群及正常人血液中这些生物学指标含量的差
日本茶庭设计与茶道仪式过程涉及诸多声音美的艺术化运用手法,这对日本茶庭独特艺术境界的形成,尤其是“和、静、清、寂”艺术风格的形成至关重要。论文采用文献研读与案例分
<正>语言是社会政治、经济、思想、文化的象征,一定时期的新词新语是一定时期人们思维方式和生活方式的反映。随着社会的迅猛发展,人们生活水平、生活环境发生的巨大变化,新
乌江民间枕顶绣图案纹样是乌江地区民间艺术的经典代表,并具有较高的艺术价值。本文旨在通过对乌江地域文化的考察分析,着重从自然环境和历史人文两方面来阐述枕顶绣图案纹样
<正>基层政府部门能主动开展媒体公关,说明了时代的进步和我党执政理念的发展。但是,很多基层政府部门很难把握媒体公关的精髓,经常出现一些可笑可气可叹之案例。细细分析原
<正>目前,随着私家车的不断增多,广播媒体迎来了一个新的发展时代。下面,笔者将从广播的类型、内容设置以及传播途径对全国省级广播媒体的现状进行简要分析,并对中国广播的未
本文首先以我国和发达国家之间、国内城乡之间的数字鸿沟为考察重点,讨论数字鸿沟现象和影响;然后利用国际电信联盟(ITU)建立的全球信息通信技术发展指数(IDI)的测度方法,对
N公司是A市的鲜活商品贸易龙头企业,依靠政府的政策支持,鲜活商品年贸易额占A市市场份额的80%以上,同时管理着A市唯一的鲜活商品批发市场。近年来,随着政策干预的减少,依靠政
目的探讨肝外胆管癌(ECC)患者肿瘤组织中谷氨酸脱氢酶(GLDH)的表达水平及其临床意义。方法选取2005年1月~2015年12月于榆林市第一医院肝胆外科手术切除的160例ECC患者组织标本
国民经济的快速发展在改善人民生活水平的同时也给城市带来了一系列的交通问题,如道路拥堵、空气污染、噪音污染、停车困难等等。基于城市公共交通载客量大、低排放等特点,优