【摘 要】
:
深度学习因其为非结构化数据提供了强大的自动特征提取和表征能力,从而在计算机视觉、自然语言处理、机器人技术等人工智能领域展现了优异的性能。针对不同的实际应用场景,人工设计出了许多高性能神经网络结构,但手工设计网络结构往往需要丰富的目标领域专业知识与极高的人工成本。为了解决这一问题,自动化设计神经网络结构受到了学术界和工业界的广泛关注。神经网络架构搜索(Neural Architecture Sear
论文部分内容阅读
深度学习因其为非结构化数据提供了强大的自动特征提取和表征能力,从而在计算机视觉、自然语言处理、机器人技术等人工智能领域展现了优异的性能。针对不同的实际应用场景,人工设计出了许多高性能神经网络结构,但手工设计网络结构往往需要丰富的目标领域专业知识与极高的人工成本。为了解决这一问题,自动化设计神经网络结构受到了学术界和工业界的广泛关注。神经网络架构搜索(Neural Architecture Search,NAS)是目前自动化网络结构设计的主流方法。其中可微分神经网络架构搜索算法将离散的体系结构搜索空间松弛为连续的,从而利用梯度来优化体系结构参数来搜索网络结构,因此极大地减少了计算资源的消耗,促进了NAS算法的实际部署与应用。然而,搜索空间的连续松弛和可微分的搜索策略在高效完成网络结构搜索的同时也致使可微分NAS算法存在一系列的固有缺陷。因此,本论文旨在进一步优化可微分神经网络架构搜索算法,弥补其自身的固有缺陷和根据实际应用需求使算法具备硬件感知能力,提升可微分NAS算法的搜索性能和结构的泛化能力。首先,本论文提出了多路径限制连通可微分神经架构搜索算法。针对可微分神经网络架构搜索算法固有的深度差距和搜索崩溃问题,提出了限制连通算法和优化了算法的参数映射方式与损失函数。限制连通算法加深了体系构建单元的深度,使其更加适合深度网络从而减少评估网络体系构建单元的堆叠数量,弥补了深度差距。设计的0-1系数损失与归一化合作式参数映射函数简单高效地解决了搜索崩溃问题,使算法可以在有限的资源下进行更精确的搜索。同时,本文提出的方法也填补了可微分NAS应用于多路径搜索空间的空白,精心设计的适配可微分搜索策略的多路径搜索空间使得体系构建单元能够提取和融合不同尺度的特征,提升了网络的特征提取和表示能力。多路径限制连通可微分神经架构搜索算法以最少的参数量(仅2.5M)在基准数据集上实现了最先进(state-of-the-art,SOTA)的性能且搜索出的结构表现出了强大的泛化能力。接下来,可微分NAS算法因其复杂的搜索空间表示而导致难以使搜索策略具有硬件感知能力,但移动终端的普及和人工智能应用场景的扩宽都迫切要求网络结构在目标硬件设备具有低推理延时的特性。因此,本论文提出了硬件延时感知的可微分神经网络架构搜索算法。首先构建目标硬件设备的延时预测代理数据集、然后利用软注意力机制和Mish激活函数搭建硬件延时预测网络,从而精准预测复杂搜索空间中网络结构的延时,最后将硬件延时约束嵌入可微分神经网络架构搜索算法。本文提出的方法可以高效低成本地转移到不同的硬件设备,搜索得到兼顾精度与推理延时的高性能网络结构,满足了可微分NAS算法的实际应用需求。本论文研究并实现了对可微分神经网络架构搜索算法的优化,提出的方法实现了低资源消耗的精准网络结构搜索,满足了复杂人工智能任务对网络性能的高要求,并且对于神经网络在移动终端和边缘计算设备上的部署有着重要的理论意义和实用价值。
其他文献
随着计算机应用技术与硬件设备的发展,人机交互的方式从传统的键盘鼠标,到后来的数据手套、触摸屏,再到目前非接触交互的方式,不断更新的交互方式满足了人们日益增长的交互需求。其中,非接触式的手势作为一种新兴的人机交互方式受到了学术界和工业界的广泛关注。传统的手势识别方法多采用基于人工提取特征的方式,存在着泛化能力差等局限性,无法满足现阶段人们的需求。近年来,深度学习在计算机视觉领域取得了巨大成功,这为手
随着集成电路规模的增长和现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)集成度的提高,FPGA电子设计自动化(Electronic Design Automation,EDA)工具的处理能力已经跟不上日趋复杂的电路和芯片结构,其编译时长和结果质量都成为了目前主要的性能瓶颈。布局是EDA流程中最为关键、耗时最长的环节之一,其布局结果质量对FPGA电路系统的
步入集成电路时代以来,FPGA正以前所未有之势,驱动着通信领域、数字信号处理领域等现代数字系统高速发展。国内的FPGA研究主要基于学术虚拟FPGA芯片和学术开源EDA软件,但是随着半导体制造工艺的提升,商业FPGA芯片的资源数量飞速增长,各项指标远超学术芯片,这导致FPGA芯片设计和相关理论研究变得愈加困难。因此,提供国际先进商业FPGA芯片模型实例对于探索FPGA体系架构和EDA算法研究具有重要
近些年来,越来越多的证据表明,非编码RNA(nc RNAs)与癌症的发生和诊疗密切相关。全基因模型的研究指出,核心基因的强效应、外围基因的弱效应在生物网络中的累积作用与复杂疾病相关,而大多数具有弱效应的变异发生在非编码区域。癌症作为典型的复杂疾病,其发生既受基因变异和异常表达的影响,又与基因间的相互作用有关。基于网络模型挖掘表征癌症的子图是研究癌症的重要途径,这可以揭示癌症分子机制,并提供潜在的诊
在钢材制造过程中,一方面由于机器质量、人为误操作等因素,导致工业产品表面缺陷问题难以避免,为了保证产品自身的价值,必须及时处理这些缺陷。另一方面,深度学习方法已被证明在图像处理的各个领域都优于传统的机器视觉方法。而钢材生产环境中有限的资源配置与深度学习中庞大的神经网络模型之间却存在着相互制约的关系,导致难以将这些神经网络模型应用在钢材质检流程中。对于深度学习而言,模型的好坏取决于训练数据的规模大小
近年来,随着集成电路设计与制造水平的不断提高,开关电源产品正在向高效率、高集成度、小体积以及高功率密度等方向发展。而传统的采用二极管作为开关电源整流器的方式在低压大电流的应用背景下会产生较高的整流损耗,不利于开关电源效率的提升。因此提出了同步整流(Synchronous Rectification)技术,即采用通态电阻极低的功率MOSFET来代替传统二极管作为整流器件,可大幅降低整流管的管压降,保
近年来,随着计算机行业的高速发展,相关的高性能应用已经成为当今社会生活不可缺少的一部分。围绕这些高性能应用展开的相关研究也已经成为计算机系统结构、算法和编程等领域的热点,而这些高性能应用一般都伴随着大容量、高速度、多类型的数据处理和计算。伴随着后摩尔时代的到来,算力已经成为制约高性能计算发展的重要因素之一,从而使得多核心并行计算逐步成为主流,但不容忽视的是,这些高性能计算虽然带来了算力的提高,但是
随着空间电子技术的发展,未来航天器将采用分布式综合模块化电子系统,这将是占领太空网络战略至高点的关键技术保证。总线网络作为卫星、航天器的“神经中枢”,在信息传输的过程中起着至关重要的作用。海量的数据处理,高速的信息传输,复杂的应用场景,对航天器总线网络的可靠性、实时性、多源融合网络数据流传输的要求越来越严格。传统的卫星以及航天器普遍采用1553B数据总线进行模块间信息的传输,其效率低下、互联繁琐、
黑色素瘤是由黑色素细胞病变形成的肿瘤,该肿瘤的治疗主要通过早期手术切除,但其早期一般无明显疼痛或瘙痒等症状,导致发现非常困难,而黑色素瘤中后期的治疗预后效果极差。随着单细胞测序技术的发展,在细胞水平对基因表达情况的度量得以实现,为癌症等复杂疾病的分子机制研究提供了新的分析角度。本文基于单细胞RNA测序数据识别黑色素瘤的候选生物分子标记物,为黑色素瘤的诊断、治疗和预后等方面提供相关信息。主要工作总结
推荐系统是大数据时代背景下不可或缺的应用之一。在现今的大数据时代,信息过载已成为一种常态现象,而推荐系统能够帮助用户从海量信息中更加快速地找到他们所感兴趣的内容。在常用的推荐系统算法中,往往需要将用户所有的信息(如用户的身份信息,历史交互信息等)都加以利用来生成个性化服务。但在很多实际场景中,是无法获取用户所有的信息,比如说用户是匿名的;此时用户身份信息以及历史交互信息无法获取,传统的推荐算法将无