论文部分内容阅读
视觉芯片是一种模仿人类视觉系统,单芯片集成了高速图像传感器和大规模并行图像处理电路的新型超大规模数模混合集成电路,相比传统图像处理系统具有高速度和高集成度的优势,可广泛用于各种高速实时图像处理领域及微小型嵌入式图像系统。但目前已报道的视觉芯片体系架构缺乏完整的片上图像系统功能、特别是缺乏片上高速图像特征识别能力,实用价值被严重制约。为解决该关键问题,本文从视觉芯片架构定义、电路设计和算法开发三个方面展开协同研究,取得的主要研究成果如下:论文提出了一种基于冯诺依曼多级并行处理器和非冯诺依曼自组织映射(Self-Organizing Map, SOM)神经网络混合处理架构的新型视觉芯片,具备完整的片上处理功能,以及像素级、行/列级、矢量级和线程级多级并行处理能力,可高速完成包括特征识别在内的各阶段图像处理任务,以达到1000fps系统级性能。论文提出了面向视觉芯片的SOM神经网络改进模型,该模型支持片上在线训练,且训练和识别过程仅需简单的加减运算和移位操作,易于硬件并行实现。论文提出了冯诺依曼像素级并行处理器和非冯诺依曼SOM神经网络之间的动态重构技术,以高速完成片上图像特征识别。重构开销仅为~2%芯片面积和3个时钟周期。基于该重构技术实现SOM神经网络,相比单独实现可节约30mm2芯片面积。还提出了行并行阵列处理器条件操作和跳跃链电路,以加速广域图像处理。论文提出了视觉芯片上的大规模并行算法设计技术,研究了复数扩散滤波、最小核值相似区(Smallest Univalue Segment Assimilating Nucleus,SUSAN)角点检测、尺度不变特征变换(Scale Invariant Feature Transform,SIFT)特征点检测、基于Mumford-Shah泛函的显著边缘提取、地平线检测追踪、手势识别及指尖追踪、人脸检测及识别等多个先进应用算法在视觉芯片上的具体实现。基于上述提出的架构、电路和算法,论文采用0.18μm1P5M CIS工艺流片实现了基于冯诺依曼/非冯诺依曼混合处理的具有完整片上图像系统功能的视觉芯片,并搭建芯片测试平台成功运行了上述各个算法。该视觉芯片达到了包括从图像采集到特征识别全过程在内的1000fps系统级性能,其中特征识别所耗时间小于0.1ms。