基于CPU模拟器加速框架的SPEC CPU2006基准程序集相似性分析

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:hesion001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于几乎所有的计算机架构研究和设计,由于制作真实CPU原型来分析微架构的性能和行为需要极高的设计成本和极长的研发周期,同时不断提出的新技术如多核、超标量的出现也需要CPU微架构快速的更新和迭代,因此使用CPU模拟器是让未来架构的定量评估成为可能的重要方式。模拟器通过帮助研究人员快速评估大量架构设计的性能,从而降低项目的成本和时间。然而,由于模拟器设计和实现极其复杂,同时模拟器经常模拟的程序是那些应该运行在硅芯片上的程序,当前大多数周期精确模拟器的执行速度与真实硬件相比是极慢的,因此模拟一个基准测试程序集中的所有程序是几乎不可能的。为了降低模拟时间,研究人员提出了各种各样的解决方案,例如选择模拟基准程序集中的一个子集,使用减小后的输入集,或者选择程序中有代表性的程序段进行模拟。但是这些研究往往只能用于特定的领域,而且目前并没有一个完整的框架支持这些加速技术。  本研究提出了一种低耦合于实际使用模拟器的设计方案,通过对于整个系统的模块化设计,可以容易地将现有的加速技术作为一个模块整合进系统,并且提出了一个不同于这些加速技术的新方法,即利用集群来并行执行模拟。这样不仅能利用到所有的计算资源,大大节省模拟时间,而且能帮助研究人员快速进行计算机体系的设计和评估。并利用我们的加速框架对于SPEC CPU2006基准程序集合进行了分析,选出了有代表性的子集,进一步缩短了未来利用该基准程序集运行模拟的时间。  基于上述设计思想,首先,本研究以Celery分布式队列为基础,研究了利用集群计算资源同时执行不同的模拟任务进行任务处理的方法;其次,研究了如何将SimPoint加速技术集成进我们的框架。基于这些研究,首先从模拟器的并行加速框架功能建模角度,开发了一个CPU模拟器并行加速框架,与具体模拟器和现有加速技术松耦合,供研究人员使用,之后,利用加速框架对于SPEC CPU2006基准程序集进行模拟执行,获取模拟的各种性能数据,并结合程序各自的架构无关的属性,通过统计和聚类技术选择出了有代表性的子集,进一步提高了加速效果。将模拟器执行一次性能验证的时候缩短到了15分钟之内。最后本文总结和分析了当前研究的优势和不足以及未来的研究方向。
其他文献
包分类问题是路由器、交换机等网络核心设备的关键问题,同时在高速防火墙、高速入侵检测等系统中也具有重要作用。下一代互联网提供的各种增强服务,如不同级别的服务、安全网关
挖掘机称重技术在工程中非常重要,准确的称重保证了货物装载和卸货过程中快速、有效。挖掘机在其工作过程中往往没有在线的计量装置和设备,工作人员的工作量计算常常以车次计量
随着XML (eXtensible Markup Language)数据已逐渐成为网络上信息的主要表示和交换标准,对于XML数据检索的需求越来越多。由于XML数据自身的特性,使得对XML进行数据检索面临
随着网络的发展,Internet上的信息量不断地扩增,这其中每天更新的信息就有数以万计之多。要在这样的一个庞大的信息库中找到自己有用的信息需要一个高效的检索工具来完成,而
随着P2P技术的大规模使用,基于P2P技术的应用消耗了大量的网络资源。由于P2P应用不了解底层网络信息,导致大量不必要的网络资源消耗。如果网络服务提供商(Internet Service P
在以往的网管建设过程中,网管接口测试经常被忽略,这主要体现在网管系统的引进过程中没有经过严格的测试,网管系统的质量无法保证,对全网网管系统的现状没有统一的概念,为网
正交频分复用多址(OFDMA)系统已经成为第四代移动通信的主流多址技术,将其与自适应技术相结合,能充分利用无线信道中的频率分集和多用户分集,提升无线通信系统的频谱效率。博
中医药技术在中国历史上发挥了巨大作用,实践证明其是疾病诊疗上行之有效的重要手段。如何结合现代信息技术和传统中医药知识,加速中医药领域的发展,促进中医药在实际临床中的应
随着互联网技术的飞速发展以及用户网络接入速率的提高,以IPTV技术为代表的网络新应用日益成熟,并且对IPTV视频播放质量的要求也日益提高。因此,IPTV网络的质量控制研究逐渐
如今,随着智能手机的大规模普及,智能手机上应用程序迅猛发展。对于智能手机平台上的移动应用,服务提供系统对其可用性、扩展性和实用价值显得尤为重要。在这一前提下,本文明