【摘 要】
:
随着大数据时代的到来,人们对自动驾驶、计算机视觉、语音识别等数据密集型应用越加的重视。现如今,几乎所有先进的计算平台都是基于著名的冯·诺依曼架构,由于其计算和数据存储分开的特性,在处理数据时需要在计算模块和存储模块之间进行频繁的数据传输,从而造成了“内存墙”的问题。为了解决“内存墙”的问题,很多学者提出了“存算一体化”的概念,即将部分计算模式嵌入到内存中,从而减少处理器和存储模块之间的数据传输。静
论文部分内容阅读
随着大数据时代的到来,人们对自动驾驶、计算机视觉、语音识别等数据密集型应用越加的重视。现如今,几乎所有先进的计算平台都是基于著名的冯·诺依曼架构,由于其计算和数据存储分开的特性,在处理数据时需要在计算模块和存储模块之间进行频繁的数据传输,从而造成了“内存墙”的问题。为了解决“内存墙”的问题,很多学者提出了“存算一体化”的概念,即将部分计算模式嵌入到内存中,从而减少处理器和存储模块之间的数据传输。静态随机存储器(Static Random Access Memory,SRAM)有着快速存取的特点,被广泛用做高性能处理器的高速缓存。其多管的结构为实现多种功能的计算提供了可能,受到了存内计算研究者的广泛关注。现今基于SRAM存内计算的研究成果大多数是如何处理存储阵列中的列向量数据,即阵列中的列向量进行运算,然而SRAM中的数据是按行存储的,因此这些成果在实际应用时可能会受到限制。本文提出一种可处理行、列两个方向数据的9T SRAM单元结构,其既可以读取存储阵列中的行数据,也可以读取存储阵列中的列数据,以实现内存中不同类型的运算。以所提出的9T SRAM单元为基础,除了传统的SRAM模式外,本文还设计了向量的近似汉明距离计算、行向量的逻辑运算、矩阵的转置读出等存内计算功能。近似汉明距离计算是将外部输入的二进制数据与存储阵列中存储的二进制数据进行比较,然后输出两组数据近似汉明距离的模拟电压。与、或逻辑运算是将存储阵列中的两组存储字进行与、或逻辑运算,最后输出逻辑运算的准确结果。矩阵的转置则是将按行写入存储阵列中的矩阵,按列方向读出,从而达到矩阵转置的效果。所设计的存储阵列大小为128×128,并在65nm CMOS工艺下进行了仿真。接着,对计算模式下存在的计算误差进行了分析。行向量汉明距离计算的积分非线性小于3.0 LSB,列向量汉明距离计算的积分非线性小于6.7 LSB。最后,对各个计算模式下的计算功耗进行了对比和分析。行向量汉明距离计算下的能耗为1.9 f J/bit,列向量汉明距离计算下的能耗为3.8f J/bit,逻辑计算下的能耗为9.0 f J/bit,列读模式下的能耗为18.0 f J/bit。
其他文献
大规模MIMO(Massive Multiple-input Multiple-output,Massive MIMO)技术在发射器和接收器中使用多天线阵列可以数倍地提高网络连接的容量,增加信号的收发路径和频谱效率。Massive MIMO带来优势的同时也引发了一系列的问题,由于天线数目变多,导致信道增益矩阵的维度变大。因此,对基站端进行信号检测的算法提出了更高的要求,目标是实现低复杂度且高性能的
近年来随着信息收集设备技术的进步和普及,现实世界中的数据收集难度大大降低。但是数据半结构化甚至无结构化特点易导致样本的维度达到几万甚至几十万维,需要特征选择等算法来解决所带来的维度灾难问题。然而传统的特征选择方法更倾向于选取具有鉴别性的特征,忽略了数据内在的平衡性,无法得到正确结果。因此在数据挖掘和机器学习中,急需行而有效的算法从原始数据特征集中选择相关的特征。在许多真实的数据挖掘应用中,如无线传
为了支撑上层自动驾驶功能,一辆自动驾驶汽车通常安装大量的传感器来获取道路状况,并安装众多应用程序来保障其正常运行。然而,传统的车内网络缺少细粒度的认证单元和各类加密单元,很多应用程序可以过度访问自动驾驶车辆上的敏感数据,造成车辆的隐私泄露。此外,车载相机系统易受到光线影响,在极端环境下感知的准确性有限;针对这一问题,一些学者提出将车辆自组织网络与自动驾驶技术结合,提高自动避障性能,然而保障消息的安
采用主动有源装置如雷达等设备来估计目标的位置属于有源定位的范围,有源定位的一个缺点是很容易受到反辐射打击或电子干扰,使得系统的安全得不到保障,而无源定位技术的出现很好的解决了这个问题。无源定位技术相对于有源定位的主要区别在于其自身不需要发射信号,它是一种直接利用目标发射或反射的信号来获取目标位置的技术,其基本原理是利用多个位置明确的接收站共同接收目标发射或反射的信号,从中提取出能用来获取目标位置参
随着互联网的飞速发展,人们可以从互联网上获得的信息也与日俱增。而信息的激增也会带来信息过载的问题,人们虽然可以更容易地找到自己所需要的信息,但对自己而言无用的信息也随之激增。为了解决信息过载问题给用户带来的困扰,推荐系统应运而生。在推荐系统技术中,协同过滤算法是使用最为广泛的算法。但协同过滤算法发展至今仍需解决诸如数据稀疏性、冷启动等众多问题。本文针对协同过滤算法的缺陷和现有方法的不足进行深入研究
在面对恶劣环境时,单导航系统性能表现不佳,定位精度有限。随着卫星导航系统的发展与完善,相比单一导航系统,组合导航系统以其可以提供更多的可见卫星和提高定位精度受到更多的关注。同时,北斗三号系统的最新建成为组合导航系统的发展提供新动力。然而在组合系统选星场景下,冗余卫星信号的增加却加大了卫星选择的时间和计算成本。因此,本文为改善选星问题,提出基于差分进化的选星算法,利用差分进化的快速搜索能力达到快速选
现实生活中存在着各式各样的文本(印刷体或是手写体),比如书籍、支票、广告牌、考试卷,而如何自动地识别图像中的文本具有很大的应用价值和研究价值。图像中的文本信息对于其他计算机视觉任务,如图片检索、无人驾驶、场景理解、即时翻译等有着很大的帮助。因此,自然场景中的文本检测和识别引起了学术界和工业界大量关注。越来越多的纸质文档通过拍照成像进行识别,且很多文档中手写和印刷体文本混合。因此,本论文除了研究场景
行人重识别任务主要是给定一张行人图像,在一个大型的图片库中去匹配到该行人的另一张图像。近些年来不断涌出的基于深度网络的行人重识别算法在很多大型数据集上都持续刷新记录。由于现实情况下可能会存在各种遮挡物体,很多用于解决行人重识别任务的模型并不能很好地适用于存在很多遮挡的数据。因此,本文研究了在遮挡情况下的行人重识别,根据对遮挡数据的不同处理,将分为局部行人重识别和遮挡行人重识别两个子任务分别去研究。
近年来,随着移动通信技术快速发展,圆极化天线以其独有的特性被广泛用于各种各样的无线通信系统中。天线作为通信系统的不可缺少的一环,对其性能的要求也越来越高,如要求天线要具有尺寸小,宽频带,高增益,方向图良好,低成本等特性。在一些空间有限的无线通信设备中,也通常需要天线具有低剖面的结构特性,但同时具备宽带和低剖面的特性还有待研究。因此,本文主要对宽频带和低剖面这两个特性设计了三种圆极化天线,主要内容为
大规模多输入多输出(Massive Multiple Input Multiple Output,Massive MIMO)技术作为第五代移动通信系统的关键技术之一,相对于传统MIMO技术来说,增加了更多的天线数量,在系统容量、频谱效率、数据传输速率和传输可靠性等方面显著提升了系统性能。但是随着基站天线数和用户数的增加,Massive MIMO信号检测过程的计算复杂度较高,难以实现,是研究的难点问