论文部分内容阅读
本文选用学术界广泛采用的BMW(BerkeleyMultimediaWorkload)作为评测基准程序。该测试程序集包含真实的测试程序和数据集,覆盖了较为广泛的多媒体应用领域,能较好的体现多媒体负载的特征。本文的主要评测分三方面。第一方面,通过获取BMW在使用UniCore-1处理器的北大众志网络计算机上的性能数据,来衡量该处理器能够满足的多媒体应用领域。第二方面,通过SimpleScalar模拟器获取UniCore-1和UniCore-2的Cache失效率、动态指令统计和转移预测准确率,评测处理器的设计改进对多媒体应用的影响。第三方面,对BMW进行剖析,并统计对提高应用性能具有重要作用的关键代码模块以发现性能瓶颈。
评测结果显示,UniCore-1处理器在3D和视频编码等方面还存在一定性能差距,但已可满足音频、语音和文档等类型的应用。与UniCore-1相比,UniCore-2在体系结构上的改进取得了较好的效果,但在UniCore-2基础上继续增加Cache容量和相联度获得的多媒体性能提升有限。剖析结果发现提升UniCore-1的浮点部件性能会对多媒体处理能力有明显的加速效果。
在上述性能分析结果的基础上,本文分析了几种常用的多媒体加速方法,如采用专门集成电路、整点近似算法和利用特殊指令等,并将它们应用于部分多媒体应用。实验结果表明,这些方法取得了显著的效果:在UniCore-1处理器上,优化后的MPEG-1视频程序实现了全速播放,MP3解码程序的执行时间减少了47﹪。