基于近似计算的高能效电路设计技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:JAVA_Star
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的不断发展,芯片算力增长速度难以跟上信息处理需求的增长速度。对高性能电路设计的需求是未来芯片算力发展的主要推动力,而芯片算力增长长期以来依赖于工艺进步。然而,随着先进工艺节点的发展难度逐渐提高,摩尔定律和登纳德缩放比例定律变慢,先进工艺对芯片算力增长和能耗控制的助力正在逐渐减弱,导致芯片的能耗不断上升,对散热需求也不断增大,这反过来限制了芯片的算力增长,使得集成电路设计者不得不寻求其他方法来提升芯片能效。在这样的背景下,高能效设计逐渐变得越来越重要。在高能效领域,低压设计和近似计算是两种颇为有效的技术。降低电压虽然可以有效的降低电路的动态功耗,进而降低了电路的能耗,但却损害了电路的性能。劣化的性能使得低压设计往往只能存在于速度不敏感的系统和模块中,这极大的限制了低压设计的广泛应用;而近似计算虽然能够利用精度的损失换取功耗和性能的优势,但由于近似计算电路设计在大规模电路应用中对误差的估计比较困难,因而很难得到广泛的商业化应用。为了更好的应用低压设计和近似计算技术来设计高能效的数字电路,本文分别从这两种技术出发,设计了一套基于近似计算的高能效数字电路设计方法和流程。本文主要工作包括:(1)针对在低压条件下数字标准单元库单元功能容易失效、性能和可靠性较差的问题,建立了上拉和下拉网络驱动能力的比例关系,利用上拉和下拉网络的驱动能力匹配,通过筛选适合低压结构的单元及其尺寸,设计了一套低压数字标准单元库。同时,针对原有的数字标准单元库和建立的低压数字标准单元库,利用重新特征化,完成了多个不同电压点下的数字标准单元库设计。在保证可靠性的前提下,本文设计的低压数字标准单元库在测试集上取得了20%以上的能效提升;(2)利用多个不同电压点下的数字标准单元库,本文提出了一种性能优先的多电压电路设计方法和流程。通过与关键路径进行延迟匹配,本文利用脚本重新分配了电路的供电方案,采用低电压和低压数字标准单元库来替换标准电压下的部分数字标准单元,在保证电路工作频率与原电路几乎一致的前提下,实现了24%-39%的能效提升;(3)从基本的运算单元出发,本文通过对近似运算逻辑单元建立误差、功耗和延迟的模型,进而扩展到相对较为复杂的数字运算电路和系统中,较好的拟合了各种不同运算电路的误差、功耗和延迟。本文基于实际应用提出了一系列具有较好精度和性能的近似加法器和近似乘法器设计方案,并利用这些基本运算单元设计了近似FFT、DCT和FIR滤波器等近似电路,节省了不低于39%的能耗;(4)针对复杂数字运算电路难以建立误差模型的问题,本文提出了一种自动近似计算的设计方法和流程。本文利用脚本对电路误差、功耗和延迟时间建立模型并进行估计,建立了以节点近似效率为核心的一套自动化迭代节点删减的近似电路设计流程。本文在乘法器和DCT上通过这一套流程实现了较传统自动近似计算方法10.3%-32.8%的能效提升;(5)本文通过结合所提出的近似计算电路、自动近似计算方法和性能优先的多电压电路设计方法,在卷积神经网络上进行了高能效电路设计。通过在MNIST测试集上的对比,结合本文提出的高能效方案后,本文在牺牲1.6%准确率的情况下分别在人工近似计算和自动近似计算配合多电压下节省了57.5%和58.9%的能耗。通过结合近似计算和所提出的多电压设计方法,本文实现了基于近似计算的高能效电路设计方法和流程。
其他文献
学位
学位
学位
游戏教学作为一种新兴的教学模式,具备较强的趣味性,也因此更加符合小学生的认识水平和认知特点,可以有效激发学生的学习热情。游戏化教学本身具备教育性和游戏性,能够吸引学生主动参与到学习过程之中,为树立以学生为主体的数学课堂教学模式提供可靠帮助。本文主要探讨在小学数学课程中开展游戏化教学的策略,以期为小学数学教学模式的改革提供部分参考。
学位
学位
学位
车联网通过对安全信标信息(Safety Beacon Message,SBM)的分析处理,有效提高交通行驶的安全性和交通管理的智能化。但是,随着社会文明发展和进步,用户越来越重视个人隐私信息。因此,在SBM数据采集、传输、处理过程中,实现用户身份、位置、轨迹隐私保护,是当前车联网应用上亟待解决的热点问题。信息技术的快速迭代更新使得车联网应用范畴不断拓展,以数据为中心的5G移动通信网、众包、群体感知
图像传感器作为视觉系统中的重要组成部分而广泛应用于数码摄像、安防监测、汽车驾驶以及医疗影像等领域。而模数转换器(Analog-to-Digital Converter,ADC)作为光电信号与数字图像的重要接口,其性能的优劣更是直接影响成像质量的好坏。为了在填充系数、转换速度、量化精度以及面积开销之间实现优异的平衡,在图像传感器应用中,ADC通常以列级读出的方式进行排布。单斜式(Single-Slo
学位