稀疏矩阵向量乘及自动调优

被引量 : 0次 | 上传用户:tongchenggouwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数值分析领域中,稀疏矩阵是阵内元素大部分为零的矩阵。大规模稀疏矩阵广泛出现在科学计算以及工程领域中,用于大规模线性求解系统和求解矩阵特征值等问题。稀疏矩阵在很多科学问题的物理过程离散求解中都有着重要的作用,如在有限元分析中利用稀疏矩阵来表示元素之间的相互作用,在图论中利用稀疏矩阵来描述图并通过稀疏矩阵的运算来实现图的变换,流体力学偏微分方程的求解等等。目前,针对稀疏矩阵的研究已经渗入到很多领域,在结构分析、网络理论、电力分配系统、化学工程、摄影测绘学以及管理科学等方面研究中,都出现了上千阶直至几百万阶的稀疏矩阵。因此对于稀疏矩阵向量乘(SpMV)及其调优技术的研究有助于提升解决相关领域问题的运算效率,有着巨大的研究价值与意义。本文在大量阅读国内外相关研究文献的基础上,研究并实现了稀疏矩阵向量乘运算的相关优化技术与方法,给出了一种基于主成分分析法的优化技术自动调优算法,进而提出并开发了一种整合现有优化技术的数学库COSC。在以上工作的基础上,本文创新性地提出一种基于四叉树的稀疏矩阵存储方式,利用递归进行分解重排,保证在该存储格式下的稀疏矩阵向量乘运算拥有较高的Cache命中率,从而提升运算的整体性能。进一步的,本文给出了基于四叉树的稀疏矩阵向量乘优化技术的性能分析与优化原则。本文的主要工作总结如下:(1)查阅并研究国内外现有优化技术,从面向计算体系结构的优化方面入手,论述、总结并归纳了在该方向上的四类基本策略及现有优化技术的优势与不足,从而为本文的研究提供了基本的研究方向。(2)阐述和介绍了基于CSR格式的稀疏矩阵向量乘优化与自动调优。该部分通过编码实现与优化,给出了一种基于训练集与主成分分析法的自动调优策略SCS,并基于此提出一种可整合优化策略的数学库COSC。实验表明SCS的有效性,结合COSC,可以为以稀疏矩阵向量乘运算为计算热点的相关问题在解决效率上带来显著的改进。(3)提出一种基于四叉树的稀疏矩阵存储方式。该存储方式通过递归进行分解重排,保证了进行稀疏矩阵向量乘运算时的高Cache命中率,从而带来性能上的提升。基于该存储方式,本文亦提出了其上相关的优化技术,进而分析了各优化技术的性能影响。实验证明基于四叉树存储结构的稀疏矩阵在矩阵乘法中具有较高的性能,其结构利于计算并行化并具较高的数据局部性。在深腾7000高性能计算集群上的实验表明基于四叉树存储结构的矩阵向量乘较MKL的实现能获得平均63%的性能提升。(4)对本文的上述方面研究作了总结性的概括,给出了本课题今后的研究方向,展望并提出下一步工作。
其他文献
目前我国农村金融资源配置特征为:供给抑制与需求抑制并存;农村金融资源逆向流动与逆向配置并存。其内在形成机理是,不完全竞争性的市场结构导致资源配置的“外部不经济”,信
随着改革开放的深入,我国的对外经济文化交流日益频繁,人们日益重视对外宣传工作。作为向外界传播中国信息的对外宣传,有助于我们向世界说明中国,有助于影响和改变国际受众对
题目的好坏影响学生的学习负担,提高教师的题目编拟技术可以扩大教师选择题目的视野和质量。本文结合实例介绍了题目的各种编拟技术,不但能提升教师对这一问题的认识,也适合
全球化的进一步加深使得国与国之间的交流日益密切。区域争端的此起彼伏不断挑战各国外交人员在国际舞台上的表现。因而,政治语篇的重要性日益凸显。而联合国作为世界上最大的
网络科学技术的飞速发展,正深刻地改变着世界,也对当代青年的政治社会化产生了深远的影响。网络环境下的青年政治社会化,不仅是传统意义上,青年政治社会化在其领域、方式及手
新媒体艺术的发展由来已久,人们通过艺术与科学技术的结合延伸了两者的范围,随着新媒体艺术的不断发展,新的观点与方法成为新媒体艺术发展的关键。女性对于艺术来说,是一个后来者
本文通过分析明溪中药材产业的发展现状,探讨了明溪中药材产业发展过程中存在的优势和问题。在此基础上,结合明溪中药材产业的实际情况和行业未来发展趋势,树立了“立足明溪
详述了用激光衍射方法测量金属棒在温度升高时所引起的长度变化.
本文认为,当前我国企业内部管理机制存在几方面缺陷:一是管理组织模式不能适应市场经济的要求;二是管理组织适应市场变化的能力低下;三是企业内部各单位和个人的经济收益与风险分
<正>《外语学刊》1987年第2期发表了陈东东等人的《也谈深层结构与翻译问题》。文章对一些学者运用“深层结构”概念研究英汉翻译时出现的一些“欠妥之处”做了分析。拜读之