【摘 要】
:
稀疏矩阵向量乘是很多科学计算问题中的核心问题。本文针对稀疏对角矩阵,在DIA存储格式的基础上,设计了一种新型压缩存储格式CDIA,结合CUDA编程模型的特点,在计算线程上进行
【基金项目】
:
国家自然科学基金资助项目(60673150,60970033), 国家863计划资助项目(2008AA01Z137)
论文部分内容阅读
稀疏矩阵向量乘是很多科学计算问题中的核心问题。本文针对稀疏对角矩阵,在DIA存储格式的基础上,设计了一种新型压缩存储格式CDIA,结合CUDA编程模型的特点,在计算线程上进行了细粒度的任务分配,同时为满足CUDA对存储器的合并访问要求,将压缩矩阵做了相应的转置处理,设计了细粒度算法与程序,并根据稀疏矩阵向量乘特点,做了相应的程序优化。实验数据显示,这种存储格式能够很好地发挥CUDA在数据处理方面的优势,在测试数据中,最高获得了单精度39.6Gflop/s和双精度19.6Gflop/s的浮点计算性能,性能在
其他文献
目的探讨调Q激光大光斑低能量联合氨甲环酸综合治疗黄褐斑的效果。方法接收在我院患有黄褐斑的患者一共有84例,随机分为研究组、对照组,对照组对病人采取调Q激光大光斑低能量
我国自改革开放至今,对外贸易工作取得了长足进展,我国在1978年进出口总额只有355亿人民币.2013年,我国进出口总值25.83万亿人民币(折合4.16万亿美元),扣除汇率因素同比增长7.6
关联规则挖掘是数据挖掘领域中最活跃的一个分支.目前提出的许多关联规则挖掘算法需要多次扫描数据库并产生大量候选项集,影响了挖掘效率.针对加权关联规则挖掘算法中多次扫
健美操是现今高校普遍开设的一门课程,对于女子的心理、身体成长都具有十分积极的意义.为了能够更好的进行健美操教学,在本文中,将就高校开展女子健美操专项教学的价值进行一
组织工程学是临床医生、材料工程师、化学家和生物学家共同试用细胞和生物材料创造功能性组织的新领域。“组织工程学”这个名称是1987年被正式提出的,最早的定义是:“应用工
青春型精神分裂症在精神分裂症中较为多见本型病人生活难以自理,预后较差。笔者曾接诊1例该型患者,用温胆汤加减配合针刺治疗,经治患者痊愈,报道如下。1病案举例患者,张某,女
本文主要报道了我们近年来在银河并行机上采用五阶WENO格式所做的一系列直接数值模拟研究,主要包括激波与单旋涡相互作用、激波与旋涡对相互作用、激波与三维纵向旋涡的相互
在科技高速发展的情况下,电视观众对电视节目的质量提出了较高的要求,传统媒体尤其是各地方电视媒体需要抓住观众的心理进行改革,才能够提高自身的竞争力。在未来的发展之路