稀疏张量分解高性能计算理论及其应用研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户：qzccj

【摘要】

：

【作者】

：

李昊

【机构】

：

湖南大学

【出处】

：

湖南大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

通过社交媒体、购物网站、以及多传感器融合获取的数据呈现高阶、高维度以及稀疏张量数据（High-order,High-dimension,and Sparse Tensor,HOHDST）的数据形态,高维度、稀疏数据（High-dimensional,and Sparse,Hi DS）是HOHDST数据在二阶情况下的简称。同时,实际应用产生的HOHDST数据呈现低秩特征,机器学习领域的降维方法成为获取HOHDST数据的低秩因子矩阵主要工具。在降维算法中,矩阵分解可以用来提取二阶数据的低秩因子。同时,张量分解用来提取三阶甚至高阶数据的低秩因子。常见的矩阵分解方法,例如,奇异值分解（Singular Value Decomposition,SVD）以及特征值分解（Eigenvalue Decomposition,ED）处理稠密矩阵,张量分解方法,例如,高阶正交迭代方法（High-order Orthogonal Iteration,HOOI）用来处理稠密张量数据。上述针对稠密矩阵以及稠密张量分解方法的基本代数操作为SVD,然而,在计算机中,SVD通过若干矩阵向量乘法组合实现,因此进一步挖掘加速计算的空间非常少。稠密数据的SVD方法不适合处理Hi DS以及HOHDST数据,在实际问题的优化目标中,需要加入约束项目,在计算过程中涉及到频繁的Top-K SVD操作。因此针对HOHDST数据提取低秩因子的计算过程,需要考虑稀疏数据中分布不均衡的非零元素,进而设计计算效率更高的优化工具。本文的主要工作以及创新点如下:（1）基于图像处理器（Graphic Processing Unit,GPU）细粒度随机梯度稀疏矩阵分解算法。针对大规模协同过滤（Collaborative Filtering,CF）推荐系统实时、精确、可扩展的用户缺失评分预测问题,提出一种基于GPU上CUDA框架的、细粒度并行的稀疏矩阵分解随机梯度（Multi-streaming Stochastic Gradient Descent,MSGD）算法（CUDA-based MSGD,CUMSGD）。基于SGD算法的矩阵分解可以融合诸如数据隐式、显式以及邻域特征,因此SGD成为矩阵分解中常用的优化的算法。然而在CF推荐系统的矩阵分解问题中,用户与物品的相关性导致SGD并行的过载写问题。在GPU中流式处理器（Streaming Processors,SPs;Streaming Multi-processors,SMs）中数据加载和计算过程中,相关性会导致写后读以及读后写的问题。MSGD能够去除CF推荐系统矩阵分解问题中用户与物品的特征低秩因子矩阵的相关性问题,因此MSGD具有在GPU上细粒度并行特性。针对Hi DS数据集导致单GPU内存过载问题,进一步提出多GPU上Hi DS数据分割措施以及多GPU上CUMSGD（MCUMSGD）。（2）基于SGD优化算法的稀疏Tucker张量分解高性能、可扩展、并行计算方法。稀疏Tucker张量分解在计算过程中需要矩阵Khatri-Rao乘积、Knronecker乘积以及矩阵-矩阵乘法,因此稀疏Tucker张量分解面临中间结果矩阵维度大幅度增加的问题。造成中间结果维度大幅度增加的原因在于稀疏Tucker张量分解算法在优化目标中需要考虑HOHDST数据所有的非零元素。为了解决中间结果占用庞大的内存开销以及计算开销的问题,提出基于SGD优化算法的稀疏Tucker张量分解高性能、可扩展、并行计算的方法。该方法将非凸的稀疏Tucker张量分解优化问题转换为交替训练的几个凸优化问题组合。在L-Lipschitz连续以及μ凸约束下,交替的凸优化问题可以用SGD解决,因此可以将原始大规模的中间矩阵分解为小的部分矩阵,同时不影响算法的精度以及收敛性。更进一步,基于SGD优化算法的稀疏Tucker张量分解适用于细粒度的并行,因此可以更进一步加速稀疏Tucker张量分解计算开销。（3）基于GPU的细粒度、线性可扩展的稀疏非负矩阵分解方法。非负矩阵分解在提取低秩因子矩阵过程中施加了非负约束,在图像处理、推荐系统、社交网络应用中,低秩因子矩阵的非负性具有现实意义。因此非负矩阵分解能够有效提取矩阵的低秩因子。从优化角度来看,矩阵分解施加非负约束的优化过程为,对产生的二阶导数（Hessian矩阵）进行了对角近似,因此计算的结果产生的非负项目能够与其他项目相互抵消。然而计算过程中,中间结果矩阵消耗的内存资源十分巨大。同时,稀疏矩阵各行、各列非零元素分布不均衡,这种情况造成利用非负矩阵分解提取Hi DS数据的低秩因子不能共享Hessian矩阵,加剧非负矩阵分解的计算开销。我们提出一种基于单线程的稀疏非负矩阵分解方法,该方法可以利用GPU中并行处理的线程块,以线性复杂度的计算方式同时更新各个因子向量。针对大规模Hi DS矩阵,我们提出多GPU版本的单线程、稀疏非负矩阵分解方法。提出的模型也能够进一步解决基于流形空间图正则的稀疏非负矩阵分解、可扩展计算以及GPU并行难题。（4）提出一种单线程图正则、稀疏非负矩阵分解方法,该方法的计算过程中考虑的是Hi DS数据的非零元素及其位置,因此可以避免巨大的中间矩阵的巨大开销。传统的稀疏非负矩阵分解方法的优化策略为最小化稀疏矩阵与因子矩阵的测度距离,但是只考虑了欧式距离、Kullback-Leibler（KL）测度,并没有考虑数据条目之间的邻域关系。流形学习考虑的是高维流形空间的距离求解问题,利用图正则将全局流形空间上距离问题转换为局部欧式空间距离。然而现有的图正则方法考虑的是图像矩阵数据向量化以后的稠密空间,忽略了高维度、稀疏空间的邻域问题。直接将图正则的稠密非负矩阵分解方法引入,解决高维度的Hi DS数据降维问题,会造成邻域矩阵占用内存空间过于巨大的问题。在此基础上,我们进一步提出基于GPU的细粒度的并行方法,能够解决图正则、稀疏非负矩阵分解并行过载写问题。

其他文献

新型AIE探针构建及其成像检测与光动力治疗应用研究

传统染料大都具有平面共轭结构并且水溶性较差,在浓度较大时容易发生密集的π-π聚集,导致荧光和光敏性能大幅降低（聚集猝灭效应,ACQ）,这些缺点限制了传统染料的应用范围。与ACQ完全相反,聚集诱导发光（AIE）染料在聚集态时表现出很强的荧光发射,AIE光敏剂在聚集状态时也表现出优异的光敏性能,这些特点让AIE分子更适合应用于荧光成像和PDT治疗。但是AIE分子扭曲的共轭结构导致其吸收较短,会引起比较

学位

功能DNA纳米探针的活细胞成像新方法研究

DNA作为遗传物质携带体,是生物体内最重要的物质,在生物体内发挥着非常重要的作用。DNA纳米技术的发现,打破了人们对DNA只是遗传物质的固有认知。DNA的独特性质使其成为优异的纳米材料用于构建DNA纳米结构,同时也赋予了DNA纳米结构独特的性质如:可编辑性、可寻址性、特异性。基于这些性质优势,利用DNA纳米技术不仅可以构建出不同的形貌、尺寸的纳米结构,还可以构建出具有不同功能的纳米结构。因此,DN

学位

T0空间的良滤化及相关问题研究

本博士学位论文主要研究了 T0空间的良滤化及相关问题,具体研究内容如下:第一,通过定义等价关系对KF集进行了分类,在等价类集合上定义了新的拓扑,并利用超限归纳法给出了 T0空间良滤化一种新的具体构造.第二,针对Ershov构造的拓扑空间Z,研究了 Z中KF集的具体形式.接着提出了 wf-rank的概念,这是一个用来表示T0空间距离其良滤化远近程度的序数.并利用自然数集上的余有限拓扑通过超限归纳法证

学位

镍钴基化合物的制备及其电解水催化性能的研究

氢能凭借着高能量密度、清洁无污染、适用范围广而被公认为有希望替代传统化石燃料的候选者。电解水制氢既能循环应用,又易得到高纯度氢气,是一种简单可靠的制氢途径。目前电解水催化性能最优异的催化剂是贵金属催化剂,有些贵金属催化剂的析氢反应甚至具有几乎为零的过电势,然而贵金属催化剂存在价格昂贵、地球储量低等缺点,极大制约了其在电解水技术领域的工业化应用。因此,开展以廉价的、地球储量丰富的过渡金属为原料的电解

学位

MOFs基异质结光催化剂的可控合成及其去除水中典型抗生素的性能研究

近年来,大量的抗生素及其代谢产物由于处理不当进入自然水体中,引发了严重的环境问题,并对公共健康产生了潜在的不利影响。因此,如何有效去除水体中的抗生素成为了环境领域的重点关注问题。最近,材料领域的一些研究进展为污染治理特别是水处理技术的发展提供了新的研究空间。其进展之一是新材料结合光催化理论运用于水污染治理技术。鉴于金属有机框架材料（MOFs）具有高比表面积、可功能化、多活性位点以及类半导体行为等优

学位

铁电栅控二维原子晶体场效应晶体管的制备与器件特性研究

二维原子晶体的出现为在单个或几个原子层厚度极限下探索低维物理,以及为构建具有优异性能或者独特用途的功能器件开辟了新途径。原子层薄的二维原子晶体不仅具有高效的栅调控能力,而且可以有效避免短沟道效应,为微电子器件的进一步微缩化提供了新的可能性。另外,二维原子晶体具有无悬挂键的表面,可以通过堆叠两种或多种不同的二维原子晶体来制备具有原子级锐利、清洁界面的范德瓦尔斯异质结,从而有效抑制载流子散射,提升器件

学位

动态工况下汽油机性能量化方程研究及在整车能量流测评中的应用

车用发动机开发的绝大部分工作是在稳态工况（即转速与负荷基本固定）下进行。由于发动机的应用对象为运载机械,其使用工况通常为变工况,在实际使用过程中转速与负荷时刻发生变化,这就导致车用发动机的开发工况与使用工况往往不匹配,从而使发动机的实际性能表现明显低于台架稳态试验水平。因此,实际车载使用工况下发动机性能参数的检测分析与评价、关键影响因素（控制参数）的甄别、以及性能改进方案的提出,是实现整车在实际使

学位

全无机钙钛矿CsPbBr3晶体的生长制备调控及光电性能研究

钙钛矿材料是近年来新兴的一种极具潜力的半导体材料,倚靠其极佳的光电特性在光电领域具有重要应用。全无机钙钛矿CsPbX3（X=Cl、Br、I）作为其中重要的一种类型,享有高光电性能优点的同时还弥补了含有有机分子基团的杂化钙钛矿种类耐受性差的缺点,吸引了大量的研究关注。而其作为光电器件的核心材料和决定性环节,直接影响着器件中载流子的产生、迁移、复合等过程。作为一种新型半导体材料,和传统半导体材料的发展

学位

平坦色散光子晶体光纤设计及应用研究

平坦色散光子晶体光纤是一种全内反射光子晶体光纤,针对性地改变其光纤截面结构及尺寸,可很好地调整其光学特性,从而应用于各种不同场景,因此对平坦色散光子晶体的研究经久不衰。其应用可分为线性与非线性两个不同领域,前者要求信号频率在传输过程中不发生变化,后者要求信号频率被控制转换到不同的频率范围。线性应用主要应用于通信系统中,尤其是密集波分复用系统中通过增加不同频点的信道来增加传输容量。非线性应用的一个重

学位

主导企业知识基础对平台生态系统健康性的影响研究

随着互联网、移动通信、大数据等新兴技术的发展,在很多行业,尤其是高技术领域,产品越来越高端、技术越来越复杂,一家企业难以完成全部的生产环节,需要多家企业共同合作。在这些行业中,产品一般是由多个产品模块或部件构成,每家企业负责其中一个或若干模块,最后由起主导作用或牵头合作的企业根据产品架构,将这些模块进行整合,形成最终产品。这种商业模式就是平台模式。主导企业提供一个平台,内含了平台架构、合作规则、界

学位

稀疏张量分解高性能计算理论及其应用研究

其他学术论文