多核高性能处理器软件平台的设计与实现

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:wdj702
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于材料和加工技术的限制,单核处理器的性能已经难以有所提高了,无法满足应用的需求。为了进一步提高处理器的性能,必须采用多核结构的处理器。多核处理器采用了并行计算的思想,将任务划分之后并发执行,从而节省了时间,提高了效率。   多核处理器与传统的分布式系统虽然都采用了并行化的设计,但是在实现上有一定的区别。分布式系统以节点为单位,节点通过内部总线访问本地内存的速度比较快,但是节点通过相对较慢的网络连接访问其他节点的速度比较慢;多核处理器以核为单位,不同的核在同一芯片内通过高速总线相互连接,再通过共享同一个前端总线,甚至是共享同一个缓存来访问外部的主存,核与核之间的通信速度远远快于核对内存进行访问的速度。这种实现上的区别,对程序的设计有很大的影响。   无论是普通的采用串行化设计的软件,还是针对分布式系统的传统的并行化软件,都难以在多核处理器上发挥较好的性能。因此,需要为多核处理器开发专用的软件开发工具,包括编译器、调试器和多核编程支持组件等。   多核处理器分为同构多核和异构多核两种。同构多核处理器由相同的核组成,每个核用来执行相同或者类似的任务;异构多核处理器由两种以上不同的核组成,不同的核用来处理不同类型的任务。本文的工作主要是针对异构多核处理器的。   多核处理器的任务调度问题与传统的分布式系统有一定的共同点,但是又不完全相同。异构多核的任务调度类似于分布式系统中的某些静态任务调度问题,本文使用有向无环图来描述任务,并且通过在有向无环图和处理器矩阵之间建立映射的方法来完成任务调度。   在介绍了多核高性能处理器的基本原理和技术,研究发展情况,多核处理器的分类和特征等的基础上,本文以北京时代民芯公司的BM31XXMG多核处理器为例,详细的介绍了异构多核处理器的内部结构(包括主控制器和DSP单元),核间通信方式,以及主控制器与DSP单元的协同工作机制。   以这些介绍为基础,本文结合嵌入式系统开发的一般流程,分析了针对BM31XXMG的多核处理器软件开发平台的功能需求和工作流程。然后,基于这些分析,介绍了针对BM31XXMG多核处理器的软件开发平台的功能和设计,以及具体的实现。编译器、模拟器、多核编程支持组件及编程接口等组件,都进行了详细的介绍。对于BM31XXMG所采用的基于有向无环图的任务调度方式的具体实现,也进行了深入的描述。   最后,本文总结了开发工作中取得的成功和遇到的问题,并且提出了下一步提高和改进的方向。
其他文献
大规模复杂场景的真实感快速绘制是计算机图形学领域中重要的研究课题,在数字娱乐、虚拟仿真、科普教学、园林规划和数字农林业研究等方面有着广泛的应用。本文以三维几何植
三维运动捕获技术已被广泛应用于创建高质量的人体动画,目前,很多沉浸式虚拟现实应用,如虚拟装配操作训练、虚拟维修训练等,需要实时采集并重建人体运动信息,常用的商业光学
科技项目评审工作是一项复杂的工作,不仅需要很广阔的基础知识,而且还需要非常专业的领域知识,这些都会对评审专家及职能部门人员的工作量以及评估的准确性提出了很大的挑战
共享MapReduce集群允许集群资源复用且能够降低运维成本,已经被越来越多的公司采用。而在共享MapReduce集群环境中,作业调度器是保证各种作业QoS的关键技术所在。当前各种Map
随着网络的普及和深入应用,万维网上汇聚了极其丰富的信息资源,人们不再满足于门户网站、搜索引擎这种主动信息获取方式,更期望以定制、即时的方式获取与自己兴趣相关的资源
随着以信息技术为代表的科学技术的迅猛发展,信息化手段在政府行政与管理工作中的地位变得越来越重要。运用先进的数据仓库和多维分析技术,整合政府应用等数据资源,对于提升政府
对于传统的发动机营销模式而言,发动机厂家的利润来自发动机、配件的销售,随着社会的发展,客户对售后服务的要求愈加多样化,对产品的维修、保养也提出更高的要求,同时当今市
在语义Web服务的相关研究工作中,以Web服务的组合、发现为目的,已经有大量的研究人员和研究机构对其进行了广泛的研究,其中包括:OWL-S;以工作流为基础的Web服务组合;扩展现有
国民的身体健康及体质状况是一个涉及到国家长治久安、兴旺发达的根本因素。然而本世纪以来,伴随着社会生活节奏的逐渐加快,以及物质生活的日渐丰富,传统生活模式和生活习惯已然
本文以提高合成孔径雷达(SAR)实时成像处理系统性能为目标,重点研究并实现了SAR成像处理算法中三个关键运算单元。   论文设计并实现了一种高性能定点FFT IP核。论文从DFT