【摘 要】
:
线程级推测技术为开发更多的线程级并行性,充分利用多核加速传统上难以手工或自动并行化的串行程序提供可行的技术途径.然而,这种技术的性能严重地依赖于线程划分方案.有研究
【机 构】
:
中国科学技术大学计算机科学与技术系,中国科学院计算技术研究所计算机系统结构重点实验室
【基金项目】
:
教育部-英特尔信息技术专项科研基金项目(MOE-INTEL-08-07)资助;国家自然科学基金重点项目(60633040)资助;国家“九七三”计划项目(2005CB321601)资助;国家“八六三”计划重大项目(2006AA01A102)资助
论文部分内容阅读
线程级推测技术为开发更多的线程级并行性,充分利用多核加速传统上难以手工或自动并行化的串行程序提供可行的技术途径.然而,这种技术的性能严重地依赖于线程划分方案.有研究表明,仅推测执行循环所产生的并行性是不够的,但推测执行子程序结构比循环结构要难.本文提出寻找适于推测并行执行的子程序结构的基本判定依据;通过运行由Simplescalar工具集改造得到的动态剖析工具ProRV、ProFun和SPEC CPU2000基准测试程序,我们对子程序结构线程化推测执行的适合性进行详细分析,给出具有指导意义的实验分析方法和实验数据.我们发现:1无返回值的子程序结构占据程序整体执行时间的大约40%;返回稀疏整型的子程序结构占据了程序整体执行时间的大约10%,对其返回值的预测成功率在70%左右.对于其他返回值类型的子程序结构,由于对其返回值的预测成功率过低,我们认为不适合作为线程划分的对象.2简单的last-value的值预测方案对于返回值的预测是简单而且足够有效的.3访存数据依赖普遍存在于子程序与其后继代码之间,显式同步机制对于针对子程序结构的线程级推测是必要的.
其他文献
介绍和利时MACSV系统在空分系统的构架及控制策略,分析空分主要联锁条件,以及采用的控制方式。
吴敬梓的《儒林外史》作为中国讽刺文学的巅峰之作,是通过小说来对现实生活进行评价的典型例子。小说使用现实主义手法刻画了各类人士对于"功名富贵"的不同表现,选家就是其中
目的:已有证实,在足球运动中根据人体生物节律特点,选择适宜的时间补充营养,提高机体体能,获得最佳效益。实验拟进一步验证择时补充低聚糖与乳清蛋白(4∶1)饮料对大学生足球
<正>陈景元用30多年的时间,质疑和佐证秦始皇兵马俑不是秦始皇的,而"国家队"同样用30多年时间"一铲子一铲子"地证明8000陶俑是秦始皇的
目的对Kallmann综合征的临床诊断和治疗进行分析和探讨。方法此次临床研究主要以陕西省西安市第四医院2009年1月-2013年1月收治的3例Kallmann综合征患者为研究对象,对所有患者
新型的金属纳米粒子因为独特的由表面等离子体共振诱导(SPR)的光学性质和很多的潜在应用而受到社会广泛的关注。在具有SPR效应的贵金属纳米粒子中,中空纳米结构有一个很高的
导热系数是评价材料保温隔热性的重要指标,但复合材料导热系数的测定往往受到各种环境条件的约束。分别选用复合材料导热系数理论计算公式和COMSOL软件仿真方法获得复合材料
阐述CNG瓶组供气站、LNG瓶组气化站、LPG瓶组混气站3种供气气源,对比分析3种供气气源的投资、供气规模、用户规模、运营成本,给出合理选择供气气源的建议。
目的:探讨巯血通联合单硝酸异山梨酯治疗不稳定型心绞痛的临床效果。方法选取2010年10月~2012年3月黑龙江省电力医院收治的不稳定型心绞痛患者随机分为对照组和治疗组(n=32)。对