【摘 要】
:
目标检测技术的主要任务是寻找图片中人们所感兴趣的目标,并判断它的类型和位置,是机器视觉领域的一项关键技术。近年来,基于神经网络的目标检测算法在人脸识别、行人检测和智能交通系统等领域都有着广泛地应用。随着集成电路和深度学习技术的发展,面对各种高分辨率和高帧率的应用场合,为了进一步提高算法检测的性能,使用的网络层数变得越来越多,计算量和参数规模变得更加庞大,无法满足小体积、低功耗的嵌入式应用。因此,本
论文部分内容阅读
目标检测技术的主要任务是寻找图片中人们所感兴趣的目标,并判断它的类型和位置,是机器视觉领域的一项关键技术。近年来,基于神经网络的目标检测算法在人脸识别、行人检测和智能交通系统等领域都有着广泛地应用。随着集成电路和深度学习技术的发展,面对各种高分辨率和高帧率的应用场合,为了进一步提高算法检测的性能,使用的网络层数变得越来越多,计算量和参数规模变得更加庞大,无法满足小体积、低功耗的嵌入式应用。因此,本文在综合考虑各种硬件平台应用特点的基础上,选用FPGA+DSP架构作为实现智能目标检测系统的硬件平台,充分利用两种硬件平台的优势,实现了一个低功耗和低延时的智能目标检测系统。本文主要的工作内容和创新点包括:(1)针对YOLOv4-Tiny算法复杂度高、计算量和参数量大等问题,提出了一种改进后的检测算法YOLO_Ler。该算法主干网络由CSP化的先升维再降维的PDP结构组成,同时使用深度可分离卷积结合批量归一化层合并对网络进行压缩,改进后的网络参数量比YOLOv4-Tiny压缩了92%。(2)搭建了基于细粒度流水的加速架构,结合循环展开和乒乓缓存等优化技术实现了算法中卷积层和池化层的并行化加速。为了节省FPGA的存储资源,采用16位的动态定点数量化,对片上特征图数据、权重数据和片外权重数据进行分块缓存设计,并结合多通道输入输出等优化策略,提高系统的访存效率,降低系统的时延。(3)设计和实现了智能目标检测系统的其他相关模块,如SRIO数据传输模块、EMIF接口通信模块、图像缩放模块和字符叠加显示模块。在实验室设计的硬件平台上部署了YOLO_Ler算法,并使用DIOR数据集中的图片和实时的视频流对系统进行测试,将实验结果与CPU和GPU等硬件平台的测试结果进行对比。实验结果表明,提出的系统能够正确的检测出汽车和飞机,检测速度达到了CPU的18倍,实现了43.5ms的系统延时,吞吐率和能效比分别达到了265.14GOPS和11.7GOPS/W。相比于现有设计提出的系统具有较低的延迟和功耗。
其他文献
随着空间电子技术的发展,未来航天器将采用分布式综合模块化电子系统,这将是占领太空网络战略至高点的关键技术保证。总线网络作为卫星、航天器的“神经中枢”,在信息传输的过程中起着至关重要的作用。海量的数据处理,高速的信息传输,复杂的应用场景,对航天器总线网络的可靠性、实时性、多源融合网络数据流传输的要求越来越严格。传统的卫星以及航天器普遍采用1553B数据总线进行模块间信息的传输,其效率低下、互联繁琐、
黑色素瘤是由黑色素细胞病变形成的肿瘤,该肿瘤的治疗主要通过早期手术切除,但其早期一般无明显疼痛或瘙痒等症状,导致发现非常困难,而黑色素瘤中后期的治疗预后效果极差。随着单细胞测序技术的发展,在细胞水平对基因表达情况的度量得以实现,为癌症等复杂疾病的分子机制研究提供了新的分析角度。本文基于单细胞RNA测序数据识别黑色素瘤的候选生物分子标记物,为黑色素瘤的诊断、治疗和预后等方面提供相关信息。主要工作总结
推荐系统是大数据时代背景下不可或缺的应用之一。在现今的大数据时代,信息过载已成为一种常态现象,而推荐系统能够帮助用户从海量信息中更加快速地找到他们所感兴趣的内容。在常用的推荐系统算法中,往往需要将用户所有的信息(如用户的身份信息,历史交互信息等)都加以利用来生成个性化服务。但在很多实际场景中,是无法获取用户所有的信息,比如说用户是匿名的;此时用户身份信息以及历史交互信息无法获取,传统的推荐算法将无
深度学习因其为非结构化数据提供了强大的自动特征提取和表征能力,从而在计算机视觉、自然语言处理、机器人技术等人工智能领域展现了优异的性能。针对不同的实际应用场景,人工设计出了许多高性能神经网络结构,但手工设计网络结构往往需要丰富的目标领域专业知识与极高的人工成本。为了解决这一问题,自动化设计神经网络结构受到了学术界和工业界的广泛关注。神经网络架构搜索(Neural Architecture Sear
随着信息技术的飞速发展,数据呈现出多视图的特点,尤其是单视图数据不能全面描述所有实例的信息。因此综合利用多个视图来全面和准确地表示数据是很重要的。多视图学习已经成为计算机视觉、人工智能等领域广泛研讨的热门话题。作为多视图学习的一个主要的研究范畴,多视图聚类在最近十几年里得到了迅速的发展,而且取得了巨大的技术提升,也因此得到了人们普遍的重视。其中,基于子空间的聚类试图在低维特征空间中搜索数据的最优聚
随着近些年空间探索技术的蓬勃发展,太空中不同种类卫星的数量持续增加,由此带来的空间信息数量也迎来了爆发式的增长,为空间目标监视、态势感知等领域的发展带来了巨大压力。另一方面,人工智能技术也在近些年飞速发展、趋于成熟,以图像检测识别、信息检索为代表的深度学习方法为空间信息技术的进一步发展带来了曙光。如何使用这些图像数据对重点空间目标进行分类、检测是最近的研究热点。然而,使用深度学习对空间探索技术赋能
与传统的全色和多光谱遥感图像相比,高光谱遥感图像一般由数十个乃至几百个从可见光到远红外的波段组成,包含了更加丰富的空间信息和光谱信息。这一特点使得高光谱遥感图像解译在各种对地探测任务中发挥着非常重要的作用。近年来深度学习在高光谱遥感图像解译中取得了很大的进展,然而高光谱遥感图像中标记样本的缺乏也严重制约了依赖于大数据驱动的深度学习模型。因此,在小样本条件下讨论并研究相应的高光谱图像解译的深度学习方
智能医疗系统为人们提供健康服务,该系统使得医生与患者之间可以不受地域限制地进行交流并为患者提供医疗帮助。智能医疗系统包括附着在人体上的可穿戴设备与传感器,这些设备与传感器使用全球定位系统(GPS)向医疗服务提供者不断发送患者的位置以及时间戳信息,这些信息在发送给医疗服务提供者时可能会导致患者位置及敏感信息的泄露,因此必须得到保护。本文使用两种基于边缘服务器的方法来保护患者的位置隐私,我们使用机器学
图学习相关的深度学习技术在近些年得到了快速的发展,图神经网络的出现更是为图数据的诸多应用场景下的任务提供了极具竞争力的方案。然而,攻击者通过在原始图数据上添加一些难以察觉的轻微扰动所生成的对抗样本,会导致图神经网络模型产生有误差的学习结果。这将威胁到公共安全和个人隐私,不能满足一些应用场景下的系统安全性需求。因此,对图神经网络的安全性研究是十分必要的,能够推动图神经网络技术在实际生活中的应用的发展
秘密共享经过40多年的研究发展,在密码学占据重要地位。作为一种有别于传统密码学技术,除了可以保护数据,它还可以提高数据的鲁棒性。因此被广泛应用于通信密钥管理、安全协议、网络数据安全、导弹控制发射等方面。本文提出针对不同应用场景下的两种秘密共享方案,实现了对图像的渐进恢复效果。第一种方案是基于随机网格的图像秘密共享技术,该方案可以应用在计算资源稀缺的场景。针对视觉秘密共享方案恢复效果差的问题,通过减