【摘 要】
:
人工智能应用随着深度学习技术的不断进步得到了突破性的发展。深度神经网络的研究过程中,通过增加网络层数以获得更好的神经网络性能已经被验证为一个有效的改进方向。然而,随着网络层数的不断加深,处理现有的深度神经网络过程中通常会面临计算复杂度高、计算数据量大和内存带宽受限等问题,对处理系统中的存储资源和计算资源提出了非常高的要求。如何解决系统面临的“内存墙”问题,减少深度神经网络处理过程中的数据移动开销,
论文部分内容阅读
人工智能应用随着深度学习技术的不断进步得到了突破性的发展。深度神经网络的研究过程中,通过增加网络层数以获得更好的神经网络性能已经被验证为一个有效的改进方向。然而,随着网络层数的不断加深,处理现有的深度神经网络过程中通常会面临计算复杂度高、计算数据量大和内存带宽受限等问题,对处理系统中的存储资源和计算资源提出了非常高的要求。如何解决系统面临的“内存墙”问题,减少深度神经网络处理过程中的数据移动开销,成为提升面向深度神经网络的处理系统中处理效率和能效的关键。随着深度神经网络研究的不断深入,许多新技术和新方法被应用在深度神经网络中,能够减少网络参数规模,提升网络的训练和推理效率。这些新技术和新方法对处理系统带来新的挑战。如何面向新兴深度神经网络处理过程中的计算和通信需求,针对性的进行加速策略和加速器架构设计,成为深度神经网络加速研究中的另一个重点。针对以上问题,本文开展相应的研究工作,从加速策略研究和加速器架构设计两个方面进行探索,面向特定的深度神经网络进行三维光电片上网络架构的研究,主要的成果和创新点包括:1.提出了一种基于逻辑处理单元集分割的高效映射策略LSMS。使用LSMS映射策略可以根据卷积层参数和处理阵列规模的不同,合理地将逻辑处理单元集进行分割并映射到物理处理阵列中。LSMS映射策略可以在任意大小的物理处理阵列中进行使用,同时能够提升物理处理阵列中处理单元的利用效率,因此能够获得更好的系统处理性能和加速效率。2.提出了面向卷积层处理加速的GAMS新型映射策略。GAMS中使用遗传算法对所提出的将卷积层计算和通信需求映射到物理处理阵列时造成的数据移动能耗开销模型进行求解,得到数据移动能耗最优的映射方案。GAMS映射策略可以将任意参数大小的卷积层计算和通信需求高效地映射到任意拓扑结构和参数规模的物理处理阵列中进行处理,能够降低卷积层处理过程中的数据移动能耗开销,提升物理处理阵列中处理单元的利用效率。提出了一种使用GAMS映射策略的三维光电混合片上网络加速器架构3DHOENoC,进一步提升处理卷积层时的效率。3.提出了一种面向新兴深度卷积神经网络的三维光电混合片上网络加速器架构CSSAL。CSSAL中通过对光网络层和电计算层进行单独设计,能够高效的实现广播、“一对多”和“多对一”通信,并且采用处理单元间交换单元实现了电计算层中相邻处理单元间的高效通信,使得CSSAL能够拥有更好的通信能力和系统并行性。CSSAL中通过设计分布式片上存储、可重配置算术逻辑模块和基于通道固定的处理策略,实现了对逐点卷积、逐通道卷积、挤压与激励模块和残差模块的高效处理,并且极大地减少了因与片外存储之间访存带来的数据移动能耗开销。CSSAL能够在降低系统数据移动能耗开销的同时,提升系统整体处理性能,获得更快的处理执行速度。
其他文献
偏振三维成像技术是目标三维信息获取领域中的一个重要分支,其在工业品质量检测、航空地形测绘、人脸识别,以及安防监控等多个领域都具有广泛的应用前景和发展潜力。但利用光波偏振信息在求解目标表面法向量的过程中受三角函数求解多值性的影响,造成求得的法向量信息不唯一,重建得到的目标三维轮廓存在畸变,因此在利用目标反射光波的偏振特性进行三维重建的过程中,需要对法向量多值性问题进行约束。目前对非均匀反射率目标、多
假设观测变量(观测信号)由潜在的隐变量(源信号)混合而成,仅利用隐变量之间的独立性,在隐变量和混合方式均未知的情况下,从观测变量的多个样本估计混合信道,进而估计出隐变量估计值的技术称为独立成分分析(ICA).自1994年,ICA的概念正式被提出以来,ICA技术已经发展成为一种高效的统计和计算技术,并成功应用到图像、音视频、通信、金融分析等领域.针对观测变量的时域和频域表示,ICA的支撑集可以分为实
随着网络技术快速发展,形成了包含移动互联网、物联网和天地一体化网络等的复杂网络,为用户提供基于数据知识的深度服务,密钥管理作为数据安全防护的基本手段具有现实需求。复杂网络环境管理需求差异、节点资源能力不对等和拓扑高度动态等特征和约束对密钥管理提出了场景化的要求,设计场景适用的密钥管理方案成为一个亟需解决的问题。针对场景化的密钥管理需求,本文从安全性、性能和场景适用性等方面进行需求分析,以信任模型、
随着移动通信、大数据、物联网等技术的紧密结合与快速发展,以及智能终端设备的不断更新与换代,各种互联网服务不断涌现并深入到了人们生活工作的方方面面,提升了人们的生活质量。然而,数据作为互联网服务的支撑,包含了个人、企业、乃至国家的大量重要信息。同时,在互联网服务中,用户和服务商之间的数据交换与共享愈发频繁,随之而来的数据安全与隐私泄露问题日益严峻。为确保用户敏感数据的安全性,欧盟《通用数据保护条例》
近年来随着深度学习技术的发展和应用,深度学习模型的安全问题正受到更多关注,特别是能够误导深度神经网络模型的对抗样本,凭借着广存在、难察觉、危害大等特点得到了研究界的广泛关注,是目前阻碍深度学习技术得到进一步应用的主要障碍之一。本文以深度学习模型的安全问题为出发点,以对抗样本为核心,介绍和阐释了对抗样本的主要特征和构造原理,重点研究理论上的对抗样本生成问题和实际中的对抗样本应用问题,具体研究工作包括
桃果实因其色泽艳丽,风味独特,柔软多汁,营养丰富而广受消费者青睐。桃果实成熟于夏季,采后果实呼吸旺盛,常温下极易后熟软化,加之其皮薄质软、汁液丰富,易受到机械损伤和病原菌侵染而腐烂变质,严重影响果实品质。低温贮藏是采后果实保鲜的重要方法,然而桃又是冷敏性果实,在不适宜的低温下长时间贮藏容易引发果实的冷害。热处理作为一种操作简单、环境友好型处理方法而广受重视。甜菜碱作为一种相容性渗透物质,可以起到渗
针对 MOSFET(Metal-Oxide-Semiconductor Field-Effect Transistor)器件随着尺寸不断缩减带来的芯片功耗密度增加的问题,一方面可以通过具有超陡峭亚阈值摆幅的器件有效降低工作电压,从而减小单管功耗;另一方面可以采用具有多个逻辑状态的器件,在保证数据处理量的同时通过减少晶体管的数量降低芯片整体功耗。这两种方法均被认为是后摩尔时代继续推动高性能、低功耗集
随着科技的飞速发展,各种无线电系统对天线的性能提出了越来越高的要求。圆极化天线可有效对抗雨雾等天气环境以及多径效应对天线性能的影响,常用于导航等无线电系统。极化分集技术通常要求天线具有多极化辐射特性。喇叭天线因其具有增益高、方向性强、辐射效率高、性能稳定等诸多优点应用十分广泛,它既可用于无线电系统的信号收发,也常作为标准增益天线用于辐射测量。因此对圆极化和多极化喇叭天线的研究具有重要的理论意义和潜
营养品质性状改良是当前蔬菜遗传育种领域的热点研究方向之一。研究表明多数营养品质性状是由多基因控制的数量性状,易受外界环境等因素影响,导致性状改良周期长,优异品种更新缓慢,严重阻碍了蔬菜品质育种进程。萝卜(Raphanus sativus L.)是十字花科萝卜属中重要根菜类蔬菜作物,其肉质根中含有丰富的干物质、可溶性固形物、可溶性蛋白质、维生素C、可溶性总糖、硫苷以及花青素等成分,是肉质根营养品质的
GaN作为第三代化合物半导体材料的代表,由于具有禁带宽度大、耐高温高压、电子迁移率高等优异的材料性能,使其在功率电子器件中被广泛研究。GaN基肖特基势垒二极管(SBD)由于开关速度快、结电容小、开启电压低,在各种电源电路中可以作为优良的整流器使用。目前,在GaN SBD的性能优化中,高反向击穿电压和低正向导通电阻以及低开启电压性能一直是人们研究功率电力电子器件的热点。然而,器件性能的提升总是相互矛