基于软件模拟的龙芯处理器性能分析工具

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:zzdj1990
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
程序的性能分析对于发现软件的性能瓶颈,开展性能优化有重要的意义,在如今软件功能日益复杂,规模日益庞大的形势下,传统的手工性能优化已经无法满足需求,软件人员亟需准确有效的性能分析工具以助力性能优化。业界主流的性能分析工具普遍利用了处理器内的硬件性能计数器(Hardware Performance Counter)以获取处理器内部状态,并据此定位性能瓶颈,进行性能优化。   龙芯2F处理器是由中国科学院计算技术研究所开发的一款国产高性能RISC处理器,该处理器实现了64位MIPS-like指令集、多发射、乱序执行、转移预测等特征,并且在处理器内部实现了两个硬件性能计数器。主流的处理器能够应用硬件性能计数器记录多种处理器事件,而龙芯2F处理器中的性能计数器实现较为简单,能够支持的事件有限,这导致了软件人员难以利用其开展深入的性能分析。   本文开发了基于软件模拟的龙芯处理器性能分析工具。主要工作及贡献如下:   1)基于.x86平台的二进制分析工具DynamoRIO,开发移植了龙芯处理器的二进制分析工具Loongson Dynamic Runtime(以下简称LDR),该工具采用动态二进制插桩和Code Cache技术,可以获得实际工作负载下完整的运行时信息,如访存Trace、分支跳转Trace等,同时通过定义一套接口,可以在机器指令的粒度上方便的进行各种二进制操作,获得其他运行时数据;   2)将LDR应用到龙芯2F的CACHE模拟中,较好地弥补龙芯2F硬件性能计数器的不足。具体包括:开发了针对龙芯2F的CACHE结构模拟器LCACHE,结合LDR生成的访存Trace,产生了模拟结果,并将该结果与龙芯2F处理器上应用硬件性能计数器的结果进行了比较,取得较好的效果。  
其他文献
红外告警图像处理系统在交付用户使用之前,必须完成对红外告警设备的检测,而对设备的检测需要外部红外威胁环境的紧密配合。如通过现场试验来构建威胁环境,不仅成本很大,且不可能
序列比对是生物信息学中最基础的一种实验过程,这对于根据序列进行深入的生物学意义的研究,如保守区或者功能基序的判定与评价、遗传疾病的分析、系统发育分析和功能预测,具有十
作为一个科研工作者,要掌握整个研究领域的热点主题和发展趋势,需要阅读大量的文献论文。尤其是在将自己的科研成果应用到其他领域时,科研人员需耗费大量时间和精力去探索自己不
随着企业应用集成(EAI)技术以及WebService技术的成熟和发展,基于SOA(面向服务的体系结构)的松散藕合的软件体系结构成为企业信息系统发展的重要方向。相对于普通的SOA技术,
随着科技的发展和社会需求的增加,各种数字成像设备在我们生活的方方面面都得到了广泛的应用。在伴随照片和视频数量剧增的同时,其中所包含的运动模糊也变得更加普遍象。运动模
随着科学技术的不断发展,可供摄影记者拍照的镜头应有尽有。在拍摄新闻照片时,根据表现主题的需要巧用各种类型的镜头,不仅能够改变千篇一律的单调画面,同时能增强照片的感
随着生产力和科学技术的发展,现代产业创造价值的增长点已经逐步转向服务的革新,世界经济已经从工业时代进入服务时代。服务科学是一门整合传统服务相关学科技术,提高服务产
随着时代的发展,中国独生子女们到了结婚生子的高峰期,对于同为双方家庭里的“独苗苗”,下一代该随母姓还是随父姓,年轻夫妇已很难抉择。有的干脆是父姓母姓加在一起,成为了孩子的
我国第一个为地、市报纸、电台服务的卫星直播网络目前已有19家卫星接收小站并网,另有28家小站正在筹建,可望年内陆续开通。这个卫星直播网络是新华社为全国地、市报纸、电
移动agent技术中,agent可以自主的在网络中迁移并且与其他移动agent进行通信,代表用户执行相应的任务。这种技术有着降低网络负担与减少网络延迟带来的影响等优点,在现实生活中