【摘 要】
:
在处理数据密集型应用时,传统冯·诺依曼计算体系架构难以兼顾低延时与低功耗.通过数据处理架构创新,存内计算技术可有效提升处理器与内存间的通信效率并克服“内存墙”性能瓶颈.提出了一种基于2T1MTJ(双晶体管单磁隧道结)单元结构的通用型STT-MRAM(自旋转移矩磁性随机存储器)存内计算方案,通过复用存取晶体管将位逻辑运算的控制前置于阵列中,并能同时兼顾MRAM常规存储功能.结合SMIC 55nm工艺与p-MTJ紧凑模型进行了CMOS/MTJ混合仿真,并与基于1T1MTJ和2T2MTJ单元结构的同类方案进行了
【机 构】
:
福州大学晋江微电子研究院,福建晋江362200
论文部分内容阅读
在处理数据密集型应用时,传统冯·诺依曼计算体系架构难以兼顾低延时与低功耗.通过数据处理架构创新,存内计算技术可有效提升处理器与内存间的通信效率并克服“内存墙”性能瓶颈.提出了一种基于2T1MTJ(双晶体管单磁隧道结)单元结构的通用型STT-MRAM(自旋转移矩磁性随机存储器)存内计算方案,通过复用存取晶体管将位逻辑运算的控制前置于阵列中,并能同时兼顾MRAM常规存储功能.结合SMIC 55nm工艺与p-MTJ紧凑模型进行了CMOS/MTJ混合仿真,并与基于1T1MTJ和2T2MTJ单元结构的同类方案进行了性能对比.结果 表明,由于运用了和存储单元具有相同MTJ的单一逻辑运算参考单元,2T1MTJ方案的与/或位逻辑运算正确率和单元写入正确率在不同MTJ工艺偏差、TMR(隧穿磁阻效应)偏差、温度变化、电压波动情况下,整体优于1T1MTJ方案;相比2T2MTJ方案,提出方案的写入正确率高37.1%,单元面积减半.此外,还提出一种采用双阈值晶体管的改进型2T1MTJ单元结构方案,其读写性能均优于采用相同存取晶体管的2T1MTJ方案,其中对单元写入正确率的提升达9.4%.
其他文献
为提高水资源利用率,促进现代化农业发展,提出一种智能大棚控制系统.系统采用STM32微处理器作为主控模块,运用传感器采集大棚内部环境数据,并对数据进行模糊控制,获得控制命令并下发给输出设备,实现对环境因子的调节和灌溉控制.系统以智能模式为主导,远程模式为优势,人工模式为辅助,调控大棚内部环境,使农作物获得最优生长条件.智能模式基于以专家经验为规则的模糊控制算法,不需要人为调控设备,可极大节约人工成本.
超大规模集成电路(VLSI)中的详细布线是物理设计中一个重要且具有挑战性的环节.在这一阶段,所有导线的路径都会被确定下来,布线的优劣直接关系到芯片的面积和性能,路径搜索是布线中最为耗时的步骤之一.本文介绍了基于网格的布线模型,将布线问题抽象为一个图搜索问题或者多商品流问题;总结了迷宫搜索算法、A*算法、整数线性规划(ILP)算法和并行加速算法在路径搜索中的应用和针对设计约束作出的优化,结合在布线器中应用情况分析其优劣;总结回顾了基于机器学习求解算法的研究进展,分析了存在的问题,并对详细布线算法的发展趋势做
传统蝗虫优化算法在处理优化问题时依然存在收敛速度慢、易陷入局部最优的不足.为此,提出了融合混沌映射和柯西变异机制的非线性蝗虫优化算法CCGOA.通过融合混沌Tent映射与反向学习机制,对种群初始化,在确保初始种群质量较优前提下,使种群尽可能均匀分布于搜索空间;利用余弦函数设计非线性自适应系数更新机制,更好均衡个体全局搜索与局部开发能力;引入柯西变异对当前最优个体进行变异扰动,避免算法陷入局部最优.通过基准函数寻优测试,证实提出的算法可以有效提升寻优精度和收敛速度.设计了特征选择算法CCGOA-FS并应用于
针对贵州织金含稀土磷矿石进行了选矿富磷降镁实验,原矿P2O5品位21.80%,MgO质量分数8.31%,采用一段反浮选流程,可获得精矿P2O5品位33.35%,MgO质量分数为1.36%,P2O5回收率86.53%;考察了选矿产品中稀土元素总量(∑REE)和重金属元素Pb、Cd的质量分数及走向,并分析精矿中∑REE、重金属元素Pb与P2O5品位之间的相关性.结果表明:重金属元素Pb和稀土元素在精矿中富集,而重金属元素Cd在尾矿中富集,为后续含稀土磷矿石的分离利用提供了依据.
针对复杂应用场景中无线传感器网络节点失效导致的连通性故障问题,提出了一种最小级联移动的修复方法.当网络中某节点发生失效时,通过割点检测算法判断该失效节点是否对网络连通性造成影响.若该失效节点为割点,则认为该节点对网络连通性影响较大,需要对网络进行修复.该失效节点的邻居节点间距离若小于等于节点通信半径,通过邻居节点间直接建立通信链路的方式对网络进行修复.该失效节点的邻居节点间距离若大于节点通信半径,利用节点度与节点间欧式距离选举最佳候选节点,通过通信半径与邻居节点位置计算其待移动位置,最佳候选节点移动到位置
与传统无线传感器网络(WSN)不同,视觉传感器对障碍物敏感度远高于其他传感器,障碍物直接影响视觉传感器的有效感知范围.受实际场景模型仿真的局限,目前视觉传感器网络的优化部署研究大多忽略实际多障碍情形,集中于无障碍范围内情形.建筑信息模型(Build Information Model,BIM)技术可以用来自动提供实际场景要素的几何和非几何属性,可为优化算法提供可靠的场景模型输入数据.本文提出一种BIM和分段自适应迁移差分算法(Segment Adaptive Migration Difference Ev
随着全球卫星导航系统(GNSS)信号的增多,导航接收机需要处理的信道译码算法越来越多.传统的使用协处理器的方式虽然可以提高信道译码的速度,但是会消耗大量硬件资源.采用软件实现信道译码的方式虽然可以使用DSP、SIMD等指令集进行加速,但是这些指令集不是仅针对信道译码进行扩展的,其中大部分指令在信道译码中很少使用,因此导致信道译码效率较低.基于RISC-V指令集针对GNSS信道译码扩展7条专用指令,这些专用指令丰富了RISC-V的位操作.对比相同的信道译码程序,优化后的算法代码量降低,其中BCH译码和解交织
数控机床的控制通常是使用Numerical Control (NC)代码实现.如果NC代码在传输过程中被人为修改,则会对加工的零件甚至机床造成严重安全威胁.本文提出了一种NC代码自动化异常检测方法,可以较好的保护机床.使用C语言对NC代码进行形式化建模,并以线性时序逻辑(Linear-time Temporal Logic)来对NC代码形式化模型进行异常检测,实现了对NC代码的高效自动化异常检测.实验结果表明,该方法可以有效识别出5类异常操作;具有较好的可扩展性,可用于多种数控系统.
商用大型飞机飞行数据异常检测存在实时性要求高、检测点多等难点,使用传统时间序列处理软件存在处理时间长等缺点.本文提出基于可编程阵列芯片(FPGA)的门控循环单元(GRU)异常检测神经网络,对飞行振动数据源做时间序列分析异常检测.为满足高频采样数据的实时处理要求,对GRU的实现进行了多方面并行加速优化.一是提出一种结构化的并行优化方法.将权重参数保存在FPGA片上内存中并对数组做维度上的切割,使权重参数能在列维度上并行读取,配合对矩阵向量乘法的并行计算优化,实现GRU网络的高效计算效率.二是优化GRU网络激
3-D VRRAM(Vertical Resistive Random Access Memory)是一种用来降低阻变式存储器单元成本的新型架构.目前对3-D VRRAM阵列的性能评估主要集中于对写入和读取裕度的分析上.然而3-D VRRAM中的中的热串扰效应也是一个值得关注的问题,过高的热串扰会明显降低阵列中存储单元的可靠性.本文提出了一种并行输入重编码电路,通过对输入数据进行重新编码来降低大规模并行写入所引起的热串扰效应.实验结果表明,当并行写入阵列大小为4×4、4×8以及8×8时,使用本文提出的输入