基于聚焦式注意力机制及对抗生成学习的知识蒸馏型残差网络研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:fredric_cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度神经网络的运算通常都依赖于高性能的显卡,大容量的存储,优良的散热系统等,这些设备的高昂成本严重制约了其进一步发展和推广。同时,性能越优异的网络,其参数量和模型复杂度也越大,而一般的计算设备几乎无法运行。因此,对深度神经网络的压缩与加速成为业界的研究热点,但是对复杂模型进行轻量化设计,通常又会导致模型精度的损失。面对模型的轻量化导致精度下降的问题,本文以深度残差网络Res Net为例,对深度神经网络的轻量化与精度提升进行了系统的研究。以目前主流的模型轻量化方法知识蒸馏为基础架构,提出了结合聚焦式注意力机制(Focused Attention Mechanism,FA)、采用对抗生成学习(Generative Adversarial Learning,GAL)模式、基于集成学习(Ensemble Learning)的多教师混合教学网络的残差网络,改进后的网络有效地提升了图像分类任务的准确率。本文主要研究内容包括:(1)研究了聚焦式注意力机制在图像分类任务当中的应用,提出了聚焦式注意力机制与知识蒸馏相结合的网络结构。通过注意力评分机制,使得蒸馏后的深度残差网络聚焦于与目标任务相关的重要特征,对与结果无关的信息进行过滤,实现了计算资源的集中和高效利用。同时引入快捷连接,实现了权重与分值的跨层传输,避免了长距离训练造成的信息冗余,很大程度上解决了深度神经网络因网络层数过深,可能丢失前段重要信息的问题。(2)研究了对抗生成学习与知识蒸馏中教学模式之间的关系,提出将教师学生网络的教学模式转化为竞争性学习,引入判别器对教师网络和学生网络的输出结果进行区分。通过对参数的不断调整,缩小学生网络与教师网络之间的差距,增强了教师和学生的互动学习效果。在教学过程中,教师网络不断对学生网络进行监督,并与学生网络同步进行训练,保证了模型参数的及时更新,提升了学生网络应对相似任务的判别性,提高了训练效率。(3)提出了基于集成学习的多教师混合教学网络训练模式。用多教师混合教学网络代替传统的单个教师网络,以增强教师网络的教学广度与教学能力。在训练过程中,学生模型可以从多个教师网络中学习,使学生网络获得了更多的有效信息,增强了学生网络的性能。
其他文献
伴随互联网技术的更新换代、不断发展,人脸识别技术被应用于生活的各个角落,依托于人脸识别技术的产生带来了诸多的便利,相应的推动了研究学者对于依托新兴产业的识别技术的深入研究。如今,人脸识别技术已经由传统的模板匹配、几何特征等识别方法过渡为基于神经网络的人脸识别方法,在基于实验环境下的识别效果甚至已经达到精准识别的水平。但是,在基于非理想状况的现实生活中,人脸识别的效果受到很多因素的影响,包括光照、遮
经编提花鞋面的数量统计和质量检测是制鞋过程中的一个重要环节。目前,工厂主要采用人工检测方法,通过人眼视觉来检测鞋面布匹是否存在质量问题,手工标记存在质量问题的鞋面,并且人工统计合格鞋面的数量。这种检测方法存在着检测速度慢、检测准确率不高、劳动强度大等弊端,降低了企业的市场竞争力。利用机器视觉技术代替传统人工检测,是一种提高鞋面布匹检测效率和精度的重要途径。本课题以经编提花鞋面布匹为研究对象,利用机
熔体直纺长丝作为一种重要的工业纺织品生产原料,在生产生活中用途十分广泛。为方便熔体直纺长丝的存储和运输,化纤企业通常将其卷绕成化纤丝饼。在卷绕过程中,熔体直纺长丝由于导丝辊拉力不稳定以及挂钩处局部受力不均等因素影响,部分纺丝会发生断裂并出现长丝局部断头现象。企业将熔体直纺长丝局部断头的严重程度作为评判化纤丝饼质量等级的主要指标之一。目前,由于缺乏熔体直纺长丝断头自动化检测方面的相关研究,化纤生产线
近些年来随着算法、算力、数据快速地发展,人工智能的发展遇到了新一轮的机会。在本次浪潮中各行各业都受到了人工智能的影响,尤其互联网企业在本次浪潮中得到了更多的发展契机,其中在线医疗、电商、文娱等相关领域分别从人工智能技术中受惠,且人工智能也催生了一批基于人工智能技术主导的公司。本文以A公司智能客服项目作为风险管理研究对象,结合经典的风险管理理论,对项目开发过程中所面临的内外部风险进行识别、分类以及进
地域文化是城市文化的集中体现。城市的自然状况、历史底蕴与人文环境造就了城市独特的地域文化特色。导视系统作为区域的信息识别设施,除了具有方向指示的功能外,同样承载着地域文化的历史印记。基于地域文化的导视系统,对场所历史及文化的体现有着重要的作用。本研究以石库门地域文化为研究对象,探索地域文化特征应用于导视系统设计的创新方法。首先,明确地域文化的隐性特征和显性特征的提取方法,并对石库门地域文化和老码头
随着在线社交网络的发展,社交平台下的用户群体也日渐壮大。新浪微博平台注册用户接近四亿,活跃用户超过一亿,是目前国内最大的微型博客社交平台。用户可以发布微博来分享信息,其它用户也可以通过评论或转发来对信息做出反馈。庞大的用户群体使得在新浪微博平台上有诸多类似于广告营销的应用。如何将微博下的社交网络特点利用起来,高效地进行广告营销,是一个很有研究价值的问题。构建社交平台上的用户影响力传播模型,利用用户
在线评测(Online Judge,OJ)系统为编程用户提供自主练习的平台,而OJ系统中大量的题目造成编程用户的选题困扰,因此在OJ系统中添加题目推荐模块对于编程用户而言具有重要作用,可以辅助他们进行题目的选择,节省选题时间。本文首先根据学生做题通过率进行题目推荐,通过率高的题目学生容易做对,能增加其做题兴趣,所以算法的目的是给学生推荐通过率高的题目。算法使用深度知识追踪(Deep Knowled
编织物编织成型后,具有良好的力学性能,所以在我国航空航天领域有非常多的应用。同时编织物力学性能受多方面因素影响,其中编织角和跳纱都是影响编织物力学性能的关键。而在实际编织机工作过程中,对于编织物上的编织角、跳纱的检测依然停留在人工检测阶段,容易出现错检、漏检的现象,效率极低。本课题针对立体编织物加在加工生产时对编织物检测的自动化程度不高的问题,设计了一个基于机器视觉的立体编织物实时检测系统。该检测
连城地瓜干是连城县传统的地方特色产品,位居"闽西八大干"之首,已有300多年的历史,早在清代,连城红心地瓜干已成为"贡品",取名为"金薯片"。连城地瓜干色泽鲜亮,香气纯正,口感甘醇、柔软细腻、有韧性。连城县地处福建省西部山区武夷山脉南段,属中亚热带气候区,雨水及光照充足,有效积温长,
期刊
随着信息科学技术的迅猛发展和互联网的普及,各种社交软件和电商平台的数据库存储着上百亿幅图像。在海量图像数据面前,传统的基于文本的图像检索系统存在着人工标注效率低以及受主观影响较大等缺点,已经不能满足人们日常对于图像检索的需求。基于内容的图像检索系统(Content-Based Image Retrieval)是使用图像的可视化特征对图像进行检索。图像检索提取的特征需要能够准确地表述自身所包含的语义