一般稀疏矩阵相乘的混合并行算法

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:liongliong592
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
稀疏矩阵相乘广泛应用于科学和工程计算中,是科学计算中的一种常用的基本运算,其面临着数据量大,非零值分布不规则,负载难均衡,计算结果矩阵的列指数无规则分布等问题。通过矩阵分块,优化数据传输,负载均衡,改良并行快速排序方法来解决上述问题,提高了计算效率。在多线程下计算速度比商业软件Intel MKL(Intel math kernel library)平均提高56%。同时,还通过MPl+OpenMP进行混合并行优化,在共享存储系统上两者有类似的计算速度。
其他文献
近年来词袋(bag-of-words,BoW)模型因为其较高的性能而被人们认可。词袋模型的改进方法主要包括两种,一种是在图像特征表示中加入空间信息,另一种是加入语义信息。研究了结合图像特征点间的空间和语义信息的高性能图像特征表示方法,通过计算图像中视觉词间的分布距离,并提取相似的视觉词组成视觉短语,来更好地表示图像。在UIUC-Sports8图像库和Scene-15图像库上进行图像分类实验,并与传
为了从生物特征和统计角度来提高识别的性能,提出了一种基于血流图的离散余弦变换(discrete cosine transform,DCT)与特征选择相结合的人脸识别方法。该方法首先利用血流模型把红外温谱图转换成血流图,得到更具丰富频率的特征。其次,采用DCT变换可以有效地消除血流图的相关性。最后,在DCT域特征提取阶段,为了提高特征提取的有效性,特征选择和子空间学习基于一致的可分性目标:特征选择引
矩阵主特征向量(principal eigenvectors computing,PEC)的求解是科学与工程计算中的一个重要问题。随着图形处理单元通用计算(general-purpose computing on graphics pro cessing unit,GPGPU)的兴起,利用GPU来优化大规模稀疏矩阵的图形处理单元求解得到了广泛关注。分别从应用特征和GPU体系结构特征两方面分析了PE
文章认为,对城市贫困概念的界定是有争议的,但它也有一个相对稳定合理的内涵;城市贫困的原因是多方面的,既有经济体制改革的宏观社会背景,也有个人方面的微观原因。文章对城市贫困
某些工业技术用纸板需要采用微涂或表面施胶处理,才能达到使用要求的高表面强度及其他性能指标,但在表面施胶过程中往往会出现纸幅两边黏附表面施胶液进而在后续工序形成胶块