面向片上网络多核处理器的并行编程模型研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:huweibo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
片上多核技术(NoC)作为当代集成电路设计的战略性技术,是当前集成电路领域的研究热点。NoC的核心思想是将以计算机网络通信技术移植到芯片设计中来,从而代替传统的总线通信架构,NoC在可扩展性、可重用性、设计效率、带宽、同步策略等方面具有无可比拟的优势,成为解决片上通信问题最有潜力的方案之一。   片上多核芯片实现的挑战之一,在于其软件设计与硬件结构的关系非常紧密,必须基于多核硬件体系结构进行并行编程和优化,才能合理分配和使用多核的各种硬件资源,更好地发挥多核硬件体系的性能。本文在阅读了NoC领域的大量相关文献基础上,首先对当前已发表的有关NoC的设计进行了分类、总结和比较,然后着重研究了面向层次化NoC的并行编程模型,设计了一款面向NoC的测试软件。   论文基于并行计算机集群和多核处理器平台介绍了并行编程模型、并行编程语言、并行编译器等并行编程技术。然后,论文着重分析了NoC多核处理器平台上的软/硬件协同开发、并行开发环境、并行编译技术以及当前国际上关于NoC并行编程的研究进展。   在此基础上,论文针对层次化NoC硬件体系结构,提出了一种混合并行编程模型,并给出理论分析和编程框架设计。混合并行编程模型的优点在于该编程策略和硬件体系结构紧密吻合。为测试该混合并行编程模型的效率,本论文设计了一个实验,采取了混合并行的编程方式,基于计算机集群进行测试,并分析测试结果。实验发现,混合编程模型提高了并行加速比,能很好地发挥多核处理器硬件的优势。   最后,论文基于项目组自主设计的H3MP-16多核处理器,在Linux操作系统下设计了一套用于测试该处理器性能的流媒体演示系统,该系统使用原始套接字进行数据包收发,实现了ffmpeg的在线传输、同步播放,实现了完全同步、无乱屏并能对丢包率进行统计,对播放速率、效果进行调节的流媒体演示系统,为多核处理器提供了一个良好的测试和演示平台。   目前,NoC的软件设计还停留在初期阶段,本文的工作面向NoC并行软件的实现,致力于探索和解决NoC软件并行化可能遇到的问题,为设计基于NoC的软件积累了经验。
其他文献
攻读博士学位期间作者在理论分析、数值模拟和材料生长方面选取了几个可能制约GaN HEMT发展的问题进行了研究,取得了一定成果,略述如下:  1.研究GaN HEMT结构中二维电子气的
本文通过对荣华二采区10
期刊
本文通过对荣华二采区10
期刊
microRNA是一类长度在19—24nt的非编码RNA,通过序列特异的方式调控靶基因。目前靶基因数据主要是通过算法计算而来;然而这些方法之间的重复性不高。如何根据研究的需要恰当选
目的:本课题旨在研究SCN5A基因C5457T(rs1805126)位点单核苷酸多态性(single nucleotide polymorphisms,SNP)在克山病人群中的分布情况,探讨该位点基因多态性与克山病的关系。 
生态功能区划是维护区域生态安全、指导资源合理开发利用、实现环境友好条件下区域可持续发展的重要环节。本研究依据生态功能区划的相关理论,强调区域地貌单元的完整性,综合考
目的:探讨雌激素对去卵巢大鼠小脑脑源性神经营养因子(BDNF)、神经肽Y(NPY)、蛋白质磷酸酶2a(PP2A)表达水平的影响。   方法:成年雌性大鼠分为三组,正常对照组(INT),去卵巢组(
在间期细胞核中,每条染色体占据了一块特定的核区域,形成不同的空间领域称为染色体领域(CTs)。染色体领域的排列与定位不是随机分布的,其定位与染色体基因密度有关,伴随着细胞周
为了提高短切碳纤维在水中的分散性及碳纤维与后期浸渍树脂的相容性,对碳纤维进行了两亲表面处理:首先通过氧化处理使其获得亲水性官能团—OH及—COOH,在此基础上进一步接枝
尿苷二磷酸糖基转移酶2B家族17(URIDINE DIPHOSPHATEGLYCOSYLTRANSFERASE2 FAMILY,MEMBER B17,UGT2817)基因,是UDP葡糖醛酸基转移酶家族成员之一,是主要参与类固醇代谢的一种基因