神经网络前向传播在GPU上的实现

来源 :微型机与应用 | 被引量 : 16次 | 上传用户:frjazz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于CUDA架构在GPU上实现了神经网络前向传播算法,该算法利用神经网络各层内神经元计算的并行性,每层使用一个Kernel函数来并行计算该层神经元的值,每个Kernel函数都根据神经网络的特性和CUDA架构的特点进行优化。实验表明,该算法比普通的CPU上的算法快了约7倍。研究结果对于提高神经网络的运算速度以及CUDA的适用场合都有参考价值。
其他文献
针对资源受限项目调度问题,提出了一种基于人工蜂群算法的优化方法。人工蜂群算法中每个食物源的位置代表一种项目任务的优先权序列,每个食物源的位置通过扩展串行调度机制转换
提出了油气井地面测试数据无线采集的研究路线,采用采集器与中间服务器相连,采集传感器的数据,通过无线射频方式将数据传送到中间服务器,中间服务器整合处理无线射频信号,并将处理
提出了基于虚拟机技术的DCS仿真系统的实现方式.描述了虚拟控制器的具体实现方法及虚拟机技术的其他应用。
采用基于非线性核空间的主分量分析法(KPCA)和线性主元空间鉴别分析法(LDA)相结合的算法,首先将人脸图像在非线性高维空间中进行主成分分量降维,然后采用基于主元空间的LDA方法对子空间再度降维,同时利用欧式距离分类器(KNN)对样本进行有效的分类识别。采用Matlab和ORL人脸库对该算法进行验证,实验证明,该算法识别性能显著提高,明显优于其他算法。
介绍了8086全硅计算机的体系架构,设计了8086全硅计算机与SD卡连接的硬件接口,并使用软件和硬件相结合的调试方法,可快速调试验证SD卡的功能。通过FPGA的验证,SD卡作为8086全硅计
提出了喷气织机的一种新型数字化引纬控制系统,该引纬控制系统采用FPGA可编程逻辑单元产生引纬信号、引纬单稳态信号、高低压驱动信号等,同时DSP控制单元与上位机进行串行通
设计并实现了一种智能化的汽车空调冷媒回收加注机。该装置能够将已经使用过的废旧冷媒中的水分、杂质和油分离出来,使净化后的冷媒重新投入使用,同时还具有定量加注新冷媒的功
利用ArcGIS中网络分析模块对最短路径问题分情况进行了探讨,分别给出了在不同情况下如何找到不同最短路径。
针对传统的模糊C-均值算法FCM受初始聚类中心影响而易于收敛到局部极小值的问题,提出了具体的改进方法。初始聚类中心不再随机获取而是通过改进的算法有目的地进行选取,同时采
以ATmega128单片机在钢水液位监控系统的信号处理子系统为例,详细介绍了系统对模拟量、数字量以及开关量的采集与处理过程,用LCD显示模块显示数据和状态的方法说明了一些为节省