面向异构众核从核的数学函数库访存优化方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:scenery747
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数学库函数算法的特性致使函数存在大量的访存,而当前异构众核的从核结构采用共享主存的方式实现数据访问,从而严重影响了从核的访存速度,因此异构众核结构中数学库函数的性能无法满足高性能计算的要求.为了有效解决此问题,提出了一种基于访存指令的调度策略,亦即将访存延迟有效地隐藏于计算延迟中,以提高基于汇编实现的数学函数库的函数性能;结合动态调用方式,利用从核本地局部数据存储空间LDM(local data memory),提出了一种提高访存速度的ldm_call算法.两种优化技术在共享存储结构下具有普遍适用性,并能
其他文献
针对将海量爬虫节点组织成全分布式爬虫集群所遇到的高效、均衡、可靠、可拓展等问题,提出了一种基于Kademlia的全分布式爬虫集群方法.该方法通过改进的Kademlia技术建立起爬
针对传统的基于位置服务的隐私模型匿名时间较长的情况,建立了QR-TCM模型.该模型提出了隐私保护算法CRCA.通过分析影响匿名时间的因素,提出了解决用户服务延迟的方法以及位置
针对嵌入式系统同步进程的竞态条件问题,提出了一个竞态条件分析与推理模型,包括竞态依赖集、竞态协作图和竞态条件数组三要素。其中,模型分析并推理嵌入式系统中具有竞态关系的
多变元时态数据大量存在于社会科学、环境监测、金融经济、医疗卫生及地理信息等领域。对多变元时态数据集进行深入分析,创新性地将经典的层次数据可视化方法Radial Tree加以改进,提出集成度量属性的Radial Tree布局算法(LAMPRT)、基于Radial Tree的具有度量属性的多变元时态数据可视化布局算法(LOVEBRT),结合相应的人机交互策略,形成可视化方法TVBRT。案例研究证明了该
在分析了物联网通信节点使用的David数字图书馆通信协议运行的基础上,指出了此协议存在阅读器非法扫描标签和协议主体没有会话密钥的安全隐患,提出了解决安全隐患的方案。采用通信顺序进程(CSP)的形式化分析方法对提出的方案进行了建模分析,对复杂环境下的攻击者和各协议主体建立了CSP进程。在实验中,攻击者在Dolev_Yao模型下对新的协议方案模型进行攻击,最后没有发现攻击点。实验结果表明,该协议方案能
各种类型的移动平台如智能手机、平板电脑、嵌入式系统快速普及,并渗透到生活和工作的方方面面,但是移动平台在带给大家丰富多彩的应用和方便快捷的生活的同时,也带来了许多
本文对云计算和图书馆数字参考咨询服务的相关理论进行了梳理,论述了我国图书馆数字参考咨询服务的发展现状,分析其存在的不足和应用云计算技术可采用的实现模式。在此基础上,结
针对传统特征提取方法和BP神经网络相结合而存在的缺点,提出一种新的分类器模型"PCABP网"。首先利用PCA特征向量来初始化PCABP网的初始层权值矩阵,由此新模型的初始层起到取代P
能量捕获无线传感器网络(EH—WSNs)具有从环境中捕获能量的能力,可以无限期持续工作,因此具有非常广泛的应用前景。目前已有的大多数EH—WSNs路由方案往往侧重于如何有效地节能,而
“杜虎符”作为秦国调兵的凭证发挥着极其重要的作用,古语称之:“分则天下太平,合则风起云涌”其中的奥秘影响至今。随着时代的变迁密码学诞生,它对各行各业信息安全起着技术