【摘 要】
:
浮栅器件(Flash)能够将存储和计算的特性相结合,实现存算一体化,但是单个浮栅单元最多只能存储位宽为4 bit的数据。面向Nor Flash,研究了卷积神经网络参数的低位宽量化,对经
论文部分内容阅读
浮栅器件(Flash)能够将存储和计算的特性相结合,实现存算一体化,但是单个浮栅单元最多只能存储位宽为4 bit的数据。面向Nor Flash,研究了卷积神经网络参数的低位宽量化,对经典的AlexNet、VGGNet以及ResNet通过量化感知训练。采用非对称量化,将模型参数从32位浮点数量化至4位定点数,模型大小变为原来的1/8,针对Cifar10数据集,4位量化模型的准确率相对于全精度网络仅下降不到2%。最后将量化完成的卷积神经网络模型使用Nor Flash阵列加速。Hspice仿真结果表明,相对于全
其他文献
为了减少无线传感器网络(Wireless Sensor Network,WSN)中能量的消耗,延长网络的生命周期,提出一种基于改进正弦余弦算法的分簇路由协议(Clustering Routing Protocol Based
With practical interest in the future applications of next-generation electronic devices, it is imperative to develop new conductive interconnecting materials a
针对目前生成以文本为条件的图像通常会遇到生成质量差、训练不稳定的问题,提出了通过单阶段生成对抗网络(GANs)生成高质量图像的模型。具体而言,在GANs的生成器中引入注意力机制生成细粒度的图像,同时通过在判别器中添加局部-全局语言表示,来精准地鉴别生成图像和真实图像;通过生成器和判别器之间的相互博弈,最终生成高质量图像。在基准数据集上的实验结果表明,与具有多阶段框架的最新模型相比,该模型生成的图像
针对目前车辆实时检测中存在定位不准确、检测精度低等问题,采用了一种以Darknet-53为骨架网络的YOLOv3车辆检测算法,将该算法模型在标准数据集Pascal-VOC2012上进行训练,以拍摄的西安南二环路的图片作为测试集进行测试。实验结果表明,YOLOv3算法的检测精度达到84.9%,相比于SSD算法,其检测精度提高了11.3%,检测速度提高了3.8 f/s。因此YOLOv3算法检测精度更好
为满足新兴网络业务日益增长的低时延服务需求,同时考虑到网络服务建设过程中愈来愈高的成本问题,提出一种资源高效的时延敏感型服务功能链的部署算法。首先,基于资源优化模
提出一种基于NOR Flash的存算一体模拟乘加电路以及相应的偏置电路,运用NOR Flash工作于深线性区的I-V特性,实现模拟乘累加运算。通过将同一位线、不同字线的两个浮栅管上电
为了提高物联网领域实体识别能力,提出基于XLNet的命名实体识别模型。通过分析物联网实体的语义特征及需求,将物联网领域的感知单元、计算单元、执行单元、消息单元、服务单元、位置单元和观测单元抽象为实体,以此自建数据集。基于XLNet模型构建"XLNet+Bi-LSTM+Attention+CRF"命名实体识别模型,并与其他语言模型作对比分析。实验结果表明,该模型能够更好地挖掘文本信息,提高物联网领域
在尚未研发出有效疫苗前,对潜在感染者和易感者的隔离对于流行病控制而言具有十分重要的意义。研究采用潜伏者具有传染性的SEIR(Susceptible-Exposed-Infected-Recovered)模
To achieve high efficiency of water electrolysis to produce hydrogen (H2), developing non-noble metal-based catalysts with consid-erable performance have been c
针对行人重识别中由于姿势变化、视角改变、遮挡等引起的识别率不高的问题,提出了融合外观特征的行人重识别方法。该方法通过两个网络分支的设计,分别提取行人的全局特征和局部特征,二者融合后得到行人的外观特征。同时结合分类损失和度量学习损失,通过多任务学习策略对两个网络分支进行模型优化。此外,该模型设计了随机擦除算法,在数据集中加入噪声,增强模型的鲁棒性。实验结果表明:融合外观特征的行人重识别方法大大提高了