【摘 要】
:
在上世纪90年代,CMOS(Complementary Metal-Oxide Semiconductor)图像传感器数字相机问世,其便以高灵敏度、光谱响应范围大等优点逐步成为市场主流。传统的CMOS图像传感器往往存在动态范围不足的问题,会出现曝光过度和曝光不足。另外,其输出的图像往往会有比较高的噪声,可能无法满足显示设备高质量图像的输出要求。对于这些问题需要使用ISP(Image Signal
论文部分内容阅读
在上世纪90年代,CMOS(Complementary Metal-Oxide Semiconductor)图像传感器数字相机问世,其便以高灵敏度、光谱响应范围大等优点逐步成为市场主流。传统的CMOS图像传感器往往存在动态范围不足的问题,会出现曝光过度和曝光不足。另外,其输出的图像往往会有比较高的噪声,可能无法满足显示设备高质量图像的输出要求。对于这些问题需要使用ISP(Image Signal Processor)图像信号处理器进行解决。在经过ISP处理的数字图像系统中,部分图像需要输出到高清接口如监视器、手机和电脑显示器等终端设备上,还有部分要用于图像识别与目标定位领域中,比如智能机器人、军事目标定位等。应用在ISP输出图像的识别算法里,CNN(Convolutional Neural Networks)即卷积神经网络使用最为广泛,该算法识别准确率高、定位精准,同时具有较高的实时性。所以,此算法成为了图像分类处理的首选方法。传统的ISP处理需要对图像传感器采集到的图像进行降噪、细节性增强、可见性提升等,但在计算机视觉领域中往往并不需要过多的细节处理和还原。本论文充分挖掘了其中的重要步骤,发现去马赛克和伽马变换对目标识别结果有着关键的影响。剖析这两步的算法原理,使用行缓存的方法设计了去马赛克算法的硬件电路,并用高效对数浮点数计算系统实现了任意伽马值的变换方法,比传统方法在面积等性能上实现了较大突破,从而完成高效的面向计算机视觉的ISP硬件电路设计。本文选取VGG(Visual Geometry Group)网络作为深度学习目标检测方案,使用GPU(Graphics Processing Unit)训练参数并导出,在ZYNQ平台上完成网络预测部分的硬件搭建。考虑片上BRAM资源和数据读取带宽,设计了数据块体结构来寄存特征数据与参数。并同时并行计算4通道数据,采用流水线方法完成乘加操作,从而设计出网络的卷积层和全连接层。对于池化层与Softmax层,分别依据算法特点提出对应的硬件优化方法。最终完成ISP—卷积神经网络联合系统设计。本文将所设计的ISP算法在MATLAB平台上进行仿真和误差分析,再使用Verilog语言进行硬件搭建,DC(Design Complier)和Vivado等工具用来对所设计的硬件电路综合与分析性能参数。分析神经网络算法,设计适用FPGA(Field Programmable Gate Array)部署的硬件模块,在ARM端将各个模块连通并使用AXI接口完成图像数据和各类的参数的传输,可以发现该联合系统得到相对理想的识别率的同时,比起传统方法效率有明显提升。
其他文献
由于心血管疾病的高致病率和高死亡率特性,它已成为危害人类健康和生命的“头号杀手”。对心血管疾病进行有效诊断和预防尤为重要。近些年,随着深度学习理论和技术的快速发展,借助深度学习对心电图进行特征分析以及病症分类已成为智能医疗健康领域研究的热点问题。但是针对于临床应用,依然存在很多实际问题需要解决:如心电图采集和传输过程中出现各种噪音干扰、缺失;大多数研究都是针对于单导联或是双导联心电图信号进行分类,
近年来,三维深度学习的研究已成为热点,它在自动驾驶、机器人等领域中都得到了广泛的应用。现阶段研究中三维模型数据集样本数量有限,规模无法与二维数据集相比,这也是困扰绝大多数研究者的问题。深度学习任务中数据集的匮乏会直接导致模型的性能出现瓶颈,数据增强技术就是为了应对这个问题而被提出的。在三维点云深度学习领域中,对于数据增强技术的研究还不多,本文主要研究三维点云数据的数据增强算法,提出的方法可以从源头
随着机器学习和人工智能等学科的发展,越来越突显出数据的重要性。个人或企业每天会产出或者收集大量的数据,数据的抓取越来越便捷,但是数据质量也逐渐引起人们的重视。其中数据缺失问题常常发生,甚至难以回避。实现算法或提供可靠的决策分析等都依赖于高质量的数据,因此数据填补是一项重要研究内容。本文首先基于自联想神经网络(Auto-Associative Neural Network,AANN)对不完整数据进行
近年来随着生活水平的显着提高,人们对移动式电子设备的性能提出了更高的要求。作为芯片的核心单元,中央处理器(Central Processing Unit,简称CPU)变得越来越重要。但是,一方面由于MOS晶体管达到了物理极限,另一方面由于以ARM等公司为代表的CPU厂商收取越来越高的专利费,CPU的发展进入了瓶颈期。RISC-V(Reduced Instruction Set Computer f
声音作为人类感知周围事物的重要媒介遍布在人们生活的各个方面,其中往往包含着重要信息辅助人们进行抉择。声音事件检测(Sound Event Detection,SED)是指将采集到的音频数据进行分类,并判断当前发生的事件或所处的场景,其在无人驾驶、智能家居、安全监控等领域有着广阔的应用前景。近年来,随着深度学习技术在各个领域的不断发展,使用神经网络替代传统音频识别的方法已经成为越来越多研究人员的选择
随着智慧城市理念逐渐成熟以及技术日益发展,智能交通成为了智慧城市中极其重要的一环。由于国家新能源政策的普及与绿色出行观念的流行,城市居民出行的方式更加倾向于非机动车。然而非机动车使用率的攀升以及对行人管理条例的不完善引起一系列交通违规,这些违规行为引发了大量的交通事故。如何对违规行为的治理科学化、常态化已经成为城市交通网络中亟需解决的难题。本文在解决上述实际问题的过程中,采用了深度学习的方法,提出
近年来,全国各大中小城市已经布满了各种型号的监控摄像头,海量的监控图像极大丰富了人脸以及行人分析任务的应用场景。在此背景下,研究智能视频理解技术,让计算机实现突发事件的准确预测和快速响应,已成为安防领域的核心需求之一。在视频监控领域,行人是主要的监控对象,人脸属性作为面部的重要信息被广泛的应用在人脸识别和人脸检索等任务中。人脸属性识别定义为给定一张人脸图像,经过特征提取,预测出一系列外观属性。根据
近年来,随着机器学习浪潮的出现,基于机器学习的目标识别算法也得以蓬勃发展。目标识别算法当中,数据集与算法是两大关键因素。合适的数据集和良好的目标识别算法能够极大的提高目标识别的速度以及准确率。现阶段使用的数据集,都是基于数码相机生成的sRGB图像。图像经过图像信号处理器(Image Signal Processor,ISP)流程从原始图像转换成sRGB图像。但ISP流程各步骤对于目标识别准确率的影
Ser Des(Serializer/Deserializer,序列化器与反序列化器或者串行器和解串器)是一种时分多路复用(TDM)、点对点(P2P)的串行通信技术。即在发送端多路低速并行信号被转成高速串行信号,经过传输媒体(光缆或铜线),最后在接收端高速串行信号重新转换成低速并行信号。该项技术充分利用了传输媒体的信道容量,减少所需的传输信道和器件引脚数目,从而大大降低通信成本,因此成为高速串行接
脉冲动态系统是一种特殊的混杂系统,由于其广泛的应用前景,近年来得到了越来越多的学者的关注。脉冲系统由于其模型的固有特性,系统的状态轨迹会出现跳变,使得在研究过程中面临的问题更加复杂多变。本文对于线性脉冲系统和非线性脉冲系统的稳定性和控制器设计分别进行研究,主要包含以下内容:首先,讨论了线性脉冲系统的稳定性和控制综合问题。本文研究的线性脉冲系统具有分段线性跳变映射,并在系统中嵌入了时间正则化。使用了