龙芯3号多核平台上性能调优环境的设计与实现

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:kuba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多核时代片上所集成的核数越来越多,龙芯芯片在继4核的龙芯3A之后也推出了8核的龙芯3B芯片。然而,程序所获得的性能提升并未随着芯片能力的提升而呈现线性增长,系统资源未被充分利用是导致这种现象产生的根本原因。没有充分发掘程序的并行化潜能、程序实现与运行平台的硬件特征不匹配、系统软件不能调整硬件资源以适应各种类型的应用,这些都会使程序不能充分利用系统资源,进而制约了性能。   性能调优工具通过监测程序运行时行为特征、分析性能数据,一方面能够帮助程序员快速分析出导致程序性能低下的原因;另一方面,这些性能信息还能够为系统软件和编译软件所使用,用来动态优化程序的性能。本文实现了龙芯3号多核芯片上的性能调优环境工具DUET,在实现时发现龙芯多核芯片对性能调优的支持还停留在单核时代。相比于其他主流芯片,在龙芯多核平台上难以有效地对程序进行调优,必须改进其性能监测能力以提高竞争力。   论文的研究工作在实现了龙芯3号多核芯片上的性能调优环境之后,还做了一些龙芯多核平台对性能调优支持的改进研究,以期为下一代的龙芯芯片设计提供指导建议。主要研究内容和成果包括以下几个方面。(1)实现了针对龙芯3号处理器硬件特征的DUET工具,包括服务器端和客户端软件。服务器端软件是在分析龙芯2F处理器上的性能调优工具TProfiler的代码和实现原理的基础上进行设计和实现的。客户端软件是为方便用户使用所设计和实现的一个交互式可视化界面软件,通过通信接口与服务器端通信。(2)对比目前主流处理器的性能监测单元PMU的设计,指出龙芯多核处理器PMU设计的不足之处,在采样的准确性和丰富性方面都必须加以改进。并结合目前关注度较高的性能调优技术,分析实现这些技术的底层硬件支持。
其他文献
近年来,互联网和软件应用技术的普及和迅猛发展,使得软件的发展逐步趋向网络化、平台化和服务化。SaaS (Software as a Service)具有按需租用、无需用户维护、便于扩展等特征
学术论文的剽窃现象屡见不鲜,如何通过有效的手段预防并遏制学术剽窃行为,已经成为各科研机构单位所关注的问题。作者所在课题组自2005起,在学术论文的剽窃检查与识别方面进
随着互联网的迅速发展,文件共享、视频直播、远程教育等大量的多用户大规模网络应用应运而生,在给用户带来丰富应用的同时也产生了庞大的数据传输问题。P2P技术通过采用分布
立体匹配是移动机器人视觉导航领域的关键技术之一,是由二维图像获取三维物体结构信息的主要技术手段。近几年来,立体匹配取得了重大进展,每年都有新的算法提出,并且一些性能
随着社会信息化的不断加快,从海量信息中快速获取所需要的信息变得越来越重要。人物检索是最常见的检索之一,而通用搜索引擎的返回结果往往是同名的不同人物实体相关网页的混
企业级应用是指那些为商业组织、企业而创建并部署的解决方案及应用。一个理想的企业级应用系统平台应该具备良好的安全性。J2EE(Java 2 Platform Enterprise Edition)是一个
近年来,数字图书馆的建设受到世界各国高度重视,并已迅速发展为人们获取知识和信息的重要途径之一。但随着数字图书馆信息的快速增长,如何从海量的数字资源中获取用户需要的
伴随着数字媒体技术的迅猛发展,加之各类社交平台的盛行,数字图像的种类和数量呈爆炸式增长。基于内容的图像检索(Content-Based Image Retrieval,CBIR)作为一种能够从海量图
TCP稳定状态的性能会受到网络拥塞的影响,如何为可获得的网络容量(瓶颈链路)选择合适的数据是一个开放性问题。网络拥塞主要是由于发送大量的数据流(如FTP数据)而导致的。本文
随着社区化搜索技术的不断发展,博客以极快的速度融入社会生活中,成为当前互联网上较重要的一种社会媒体,并随之带来博客文章数量的指数级增长,如何在数量众多的文章中准确找到与