视觉任务中的紧凑网络设计

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zkk81950868
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络在计算机视觉任务中实现了巨大的进步,其中高级视觉任务包括图像识别、目标检测等,低级视觉任务包括图像风格迁移、图像超分辨率等。越来越多的研究证明,更多的层和连接往往能够达到更好的效果,这也使得目前的卷积神经网络设计倾向于更深的层次,更复杂的结构。但是这也导致其参数量巨大,网络运行速度减缓,消耗更多的计算资源;不必要的连接甚至会给网络带来负面的影响。本文选择了图像超分辨率以及视频动作识别这两个视觉任务,分别设计了针对性的紧凑网络,在根据具体任务的特点设计网络的基础上,让网络更加高效地完成任务,充足的实验验证了所设计的紧凑网络的有效性。本文的主要工作和贡献如下:(1)就图像超分辨率任务而言,本文提出了一种基于生成对抗网络的超分辨率算法,在超分辨率网络中引入了无监督的分割网络,它可以突破类别的限制,给予网络额外的先验知识,使其能够从同一类别中学习高阶信息。无监督的分割网络通过自注意力机制结合到超分辨率网络中以引导特征自注意力,使得生成器可以强调相同类别中的纹理,并着眼于长距离的特征关系。同时本文设计了一种轻量级的跳跃连接结构,称为残差中的残差稀疏块,使得网络更加紧凑的同时提升了超分辨率网络的效果,产生了更加清晰自然的纹理。在5个超分辨率领域的经典数据集和1个本文提出的数据集上,我们对比了其他8种超分辨率算法,在客观指标、主观测试以及实际的纹理对比上,我们的方法均取得了较优的结果。(2)就视频动作识别任务而言,本文提出了 一种有效的基于增量正则化的三维卷积神经网络剪枝算法以设计紧凑网络。我们根据权重组对网络的重要性,将不同的正则化参数分配给不同的权重组。增量正则化采用增量的形式动态地调整正则化参数,小的增量使得剪枝的整个过程更加平滑,从而使得网络在边剪枝边训练的过程中,有充足的时间来进行自我调整与修复。同时我们分析每个卷积层的冗余和计算成本来确定不同层的不同剪枝率,以进一步减少精度损失。通过该方法,我们得以设计出面向视频动作识别任务的紧凑三维卷积神经网络。在UCF101数据集上,我们对比了泰勒剪枝以及卷积核剪枝的方法,在达到相同的加速比时,我们的方法所造成的精度损失均小于其余两种方法。
其他文献
氨基甲酸乙酯(EC)广泛存在于发酵食品中,是一种能在多种试验动物上造成多位点致癌的物质,对人体具有潜在的致癌性。这使得发酵食品中EC的含量成为人们高度关注的食品安全问题。氨基甲酸乙酯水解酶能将EC直接降解成CO2、乙醇和氨气,是降解EC最有效、最直接的方法,但目前已经筛选得到的氨基甲酸乙酯水解酶较少,催化活力低。为了选取一种适用于酒精饮料中EC降解的氨基甲酸乙酯水解酶,本文围绕氨基甲酸乙酯水解酶的
近年来,我国的社会信息化程度不断提高,互联网渗透进了各行各业。与之相对的,传统的文件传输方式由于存在着诸如传输效率低下、文件安全无法保障、文件传输大小受限等缺点,日渐难以满足现代企业的文件传输需求。另一方面,主流的文件传输工具在面对企业内网时也很难发挥其应有的作用。如何在企业局域网内部进行高效的文件传输成为了每个企业亟待解决的问题。基于这样的现状,本文结合企业实际网络环境设计实现了一种分布式文件传
场景建模和绘制是电子商务、公共安全、智慧城市、国防军事和虚拟现实等应用领域的基础和核心技术。随着移动互联网的发展,虚拟现实、影视和游戏行业市场规模的不断扩大,社会对场景建模和绘制的需求越来越大。但是当前虚拟环境应用还面临着web端软件绘制平台场景编辑器缺乏等问题。针对这一挑战,本文在实验室承担的国家重点研发项目云-端融合实时绘制引擎RaysEngine项目基础上,设计并研发了一套基于web端的实时
经过亿万年的进化和自然选择,天然材料通常具有人工合成材料难以获得的复杂多级结构,并具有这些复杂结构所赋予的优异性能。比如,具有层状砖-泥结构的贝壳珍珠母具有轻质高强的特性,而天然蜘蛛丝是高强高韧纤维的典型代表。因此,研究天然生物材料的复杂多级结构并对其进行仿生制备是发展高性能材料的有效途径之一。生活在寒冷极地的北极熊具有十分特殊的中空毛发,其壳层致密,由沿轴向紧密排列的微纤组成;内部核层多孔,具有
近年来,游戏和影视等行业的发展促进了图形、图像技术的提高。为了满足游戏及影视等领域对3D内容开发的需求,各公司纷纷推出了3D内容开发平台。一方面,目前的3D内容开发平台都面临着如下问题:客户端安装流程繁琐、操作界面复杂、无法多人协作、访问便捷性差。另一方面,目前在浏览器上进行Web3D开发的条件已经基本成熟。基于此,本文设计并研发了基于Web实时绘制引擎的粒子系统及动画编辑器。本文的主要工作包括以
伴随着通信技术的发展,互联网领域边界进一步拓展,各类业务不断从线下向线上迁移,然而线上业务面临着用户流量带来的稳定性挑战。互联网业务规模增长的同时,相关业务背后的技术架构也逐渐从单体架构向分布式微服务架构迁移。如何在复杂的分布式微服务架构下对日益增长的流量进行治理,这是当前急需探寻解决的难题。本文以微服务架构下的流量控制策略为研究对象,基于对传统静态流量控制策略的分析与当前业界在动态流量治理探索的
水牛乳营养价值丰富,尤其是水牛乳蛋白,不仅含有人体必需的氨基酸,还可以经酶解产生不同功能的生物活性肽,有益于人体健康。尽管我国已大力推进奶水牛业发展,但现阶段水牛乳开发利用程度较低,基础研究薄弱,水牛乳蛋白源多肽的活性鲜有报道。为筛选高抗氧化性多肽,开发功能性水牛乳制品,本研究对水牛乳AA和BB两种基因型β-酪蛋白(β-CN)酶解产物的抗氧化性进行了比较。试验所用水牛乳采自于中国广西省。首先通过选
近几年来,云计算技术发展迅猛,以容器、微服务、DevOps为代表的云原生技术得到了大量的落地实践。以云原生技术为基座建设的容器云平台越来越多地出现在人们的视野中,同时,应用架构的革新导致平台上服务、应用的部署需求越来越旺盛。为了更便捷快速地完成容器云平台下的应用部署任务,论文设计并实现了一个自动化部署系统。容器云平台上的应用自动化部署系统主要是为了实现将应用部署到云平台中,使得应用被云平台管理,以
传统电力系统实时仿真一般都是基于专有硬件设备进行并行计算,以通用的PXI工业计算机为平台,通过多核CPU并行的方法实现了电力系统的实时仿真。通过状态方程对电力系统建模,利用分布参数线路分割大拓扑,并通过图形化编程的方式实现在多个CPU核的实时并行计算。以一个6机39三相节点系统的离线与实时仿真结果验证所介绍的基于多核PXI工业计算机的电力系统并行实时仿真方法。
蜂蜜酒是蜂蜜经水稀释后发酵而成的低度酒精酒,历史久远,国内外文献中对蜂蜜酒的营养保健功能较为推崇。但目前为止,蜂蜜酒的相关研究主要集中在蜂蜜酒的成分检测分析、蜂蜜酒酿制技术的改进以及新型特种蜂蜜酒的开发方面,还没有相关报道研究蜂蜜酒的功能。本研究以枣花蜜作为研究材料,初步开展了枣花蜂蜜酒功能的研究。研究内容主要包括以下部分:(1)实验室条件下完成了成熟稳定枣花蜂蜜酒产品的酿制方法,并对枣花蜂蜜酒的