【摘 要】
:
机器学习是人工智能的核心,它使机器可以像人类一样变得“智能”,并且在保证获取新的“知识”的前提下,他会重新整合已有的“知识体系”使其更加完善,以保证提供更好的服务。本文是在基于深度学习处理器的编译器上实现内存层级的添加,本文的主要实现过程如下:研究、理解LLVM编译器实现原理,明确了LLVM编译器属于三段式编译器,它是高度模块化的编译器,前端与后端可以任意匹配。LLVM可以生成与语言无关的中间代码
论文部分内容阅读
机器学习是人工智能的核心,它使机器可以像人类一样变得“智能”,并且在保证获取新的“知识”的前提下,他会重新整合已有的“知识体系”使其更加完善,以保证提供更好的服务。本文是在基于深度学习处理器的编译器上实现内存层级的添加,本文的主要实现过程如下:研究、理解LLVM编译器实现原理,明确了LLVM编译器属于三段式编译器,它是高度模块化的编译器,前端与后端可以任意匹配。LLVM可以生成与语言无关的中间代码,该代码是前端的输出、后端的输入,后端对该中间语言进一步处理生成目标代码。在程序出现错误时我们不仅可以通过目标代码对源程序进行调试,更可以通过LLVM中间语言LLVM IR对程序进行调试,这使得LLVM更加简明、友好。我们可以通过CUDA并行编程模型和指令架构以及GPU存储层次来理解并行计算的实现原理。通过理解GPU的存储层次:共享存储器、全局存储器、常量存储器、纹理内存的原理以及在LLVM中对CUDA编译的实现,来更好的理解多核处理器的处理思路。本文主要的工作是在LLVM编译器中添加MAC语言的内存层级,即Nbuf、Wbuf、Sbuf以及LDbuf。由于LLVM可以生成与平台无关的目标代码,所以可以通过对LLVM中间代码LLVM IR实现对LLVM前端的调试,这与调试目标代码等价。本文中的主要实验都是在LLVM前端clang进行的,使用LLVM特殊的语言在clang前端添加属性,利用clang前端中已有的编译源代码添加存储层次的实现,然后对代码进行发射,可以生成LLVM的中间表示LLVM IR,没有经过优化的LLVM IR可以查看到存储层次生成的是否正确。最后我们使用两种测试用例,一种是简单的Mac程序变量声明对添加在clang前端的代码进行验证;另一种是使用Mac语言改写神经网络算子非极大值抑制nms,使用clang进行编译生成LLVM IR,进一步来验证LLVM前端添加的内存层级的实现是否正确。最后,本文的实验编译通过,得到的结果表明实验结果正确,我们可以在LLVM中间表示LLVM IR中查看到正确的内存层级信息。
其他文献
在当今人工智能时代,特征选择是具有重要意义的大数据预处理的方式。特征选择可以避免维度灾难、减少学习算法在执行过程中的时间、有效地防止过拟合现象、过滤掉噪声数据。在这个数据量如此庞大的今天,我们需要从巨大的数据量中找到一些对我们有用的数据再进行训练或者学习,所以特征选择无疑是值得研究和探讨的。特征选择是一个需要从庞大的数据集中挑选出优质的特征的过程,因此也可以理解成是一个搜索过程。而如果我们用穷举的
有机发光二极管(organic light-emitting diode,OLED)是一种视角广、发光亮度高、响应迅速、效率高、可弯曲的新型平面显示设备。近几年,为了进一步提高器件的性能和实用性,研究人员对早期的OLED器件做了许多改进,其中使用掺杂发光层和新型光电材料都是常见的手段。在发光过程中,OLED发光层内会产生各种自旋对态(极化子、激子等),并产生自旋对态间的相互转化,这些过程都会对发光
随着大数据时代的到来,实时处理大规模数据流成为亟待解决的重要问题。为了满足实时性的要求并确保处理数据流的稳定性,很多企业用户采用了各种分布式流处理系统架构或平台,它们提供的基本功能是将流处理应用程序作业任务分配给当前可用的物理资源并在这些资源之间路由数据。对于很多分布式流处理框架来说,如何将应用程序中的任务调度到物理集群上是主要解决的问题之一。目前分布式流处理系统关于延迟约束的调度算法很多关注的是
大数据浪潮席卷各行各业,新闻业也未能幸免,传统新闻生产方式经历挑战,变革蠢蠢欲动。当计算机技术与新闻变革相逢,由算法驱动的新闻应用向社会展现了新的新闻生产模式,受众
最近几年,钙钛矿作为一种新兴材料受到极大的欢迎,对其的研究发展十分迅速。因为这种材料具有良好的光吸收性,更少的非辐射性复合,溶液加工方便,较低的载流子陷阱密度等特点,有望应用在太阳能电池,有机发光二极管,光电探测器,激光等领域。本文主要研究基于有机和无机杂化钙钛矿的发光二极管。在制作发光二极管方面,可以通过改变卤素阴离子种类来调节发光波长,例如CH_3NH_3PbBr_3发光波长为520 nm左右
目的:探讨运用扩散加权成像(diffusion weighted imaging,DWI)的ADC值评估骨挫伤、骨性关节炎骨髓病灶的价值;探讨21-44岁正常人群与45-69岁正常人群的膝关节骨髓ADC值是否具有差异及正常膝关节骨髓的ADC参考值。方法:招募具有确切膝关节外伤史且病史不超过3个月、MRI平扫结果符合骨挫伤影像学表现的患者17例,符合膝骨性关节炎临床表现及影像学表现且MRI平扫能检出
在互联网技术高速发展的今天,人们的生活和面对问题的解决方法也在相应地发生着变化,随着大量研究学者对计算机智能算法的不断深入研究,计算机智能算法被应用到了各个领域,例如:图像识别、语音识别以及自然语言处理等领域,并且取得了一系列显著的成果。近些年来,人工智能技术开始应用在医学领域,并在医学文本处理方面得到了一些较好的结果。不过在医疗图像方面,由于稀有疾病患病率低以及会涉及到患者的个人信息等原因,使得
在传统粒子群优化算法(PSO)中,每个粒子利用个体最优经验和群体最优经验更新自己的速度和位置。这种学习策略简单、容易实现,但是容易出现“震荡”和“前进两步,后退一步”的现象。因此设计有效的学习策略避免上述现象的发生,进而提高搜索效率是PSO研究中亟待解决的问题。为了保护粒子潜在的优良信息,本文提出了一种维度学习策略(DLS)。该学习策略利用每个粒子的个体最优经验发现和整合群体最优经验的潜在优良维度
约束规划是人工智能领域的重要分支,在产品配置、任务调度、组合优化等问题上有广泛的应用。约束规划为实际问题提供了一种简单有效的解决方案,首先通过约束建模将实际问题抽象成统一的约束模型,然后利用约束求解技术对模型进行求解。结合相容性技术的回溯搜索算法是约束求解的主流方法之一,通过相容性技术对回溯搜索过程进行剪枝可以提高问题求解的效率。表约束是一种重要的约束的表示形式,通过枚举支持或者禁止元组将约束以表
有机发光二极管(organic light-emitting diodes,OLEDs)具有制备过程简单、来源材料价格低和超薄等优势,正逐渐被应用于电视屏幕、手机屏幕以及手环等产品中。通常在OLEDs中只有25%的单重态激子直接跃迁发光,剩下75%的三重态激子只能以非辐射跃迁的形式把能量释放,使器件的内量子效率在理论上最大不超过25%。另外,由于OLEDs本身就具有寿命较短和性能低下等特点,使得O