应用张量t积进行数据聚类和恢复

来源 :山东大学 | 被引量 : 0次 | 上传用户:ntzhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,科技发展日新月异,同时也带来了纷繁复杂的数据。数据恢复和聚类对分析高维数据有着重要的意义。许多高维数据通常近似地存在于低维子空间中,数据的低秩先验成为对数据有效恢复的关键;而在聚类分析中,许多数据通常被建模为来源于多个簇子空间,基于此对数据进行聚类,形成了时下比较热门的子空间聚类算法。在处理的数据形式上,应用传统对矩阵分解的方法时,通常需要将多阶数据样本转化为列向量,这不免破坏了数据的原有结构,导致信息损失。而保留数据原有形式,将使用张量形式进行分解。近年来在实际应用领域中,有关张量的分析有着日趋重要的作用,因此也受到越来越多学者的关注。张量运算形式随着学术界的深入探究呈现出多样化,本文采用的形式是张量t积。本文的主要工作包括:(1)理论准备:从块循环矩阵、块对角矩阵出发介绍了由矩阵概念诱导得到的有关张量t积的概念以及TSVD分解,并分析了张量子空间和向量子空间的区别与联系。(2)提出了张量对角块表示方法(TBDR):相似矩阵的对角块结构是谱聚类的关键。本文从矩阵元素、图论、方程解空间维度这三个角度对对角块结构进行阐释;并通过不同簇空间向量线性独立和张量线性独立两个实验显示张量t积在形成对角块结构的优异表现;最后提出了张量对角块表示方法,并给出了求解算法,应用于Hopkins155运动分割数据集,显示出良好的效果。(3)提出了张量加权核范数最小化鲁棒性主成分分析(TWRPCA)的数据恢复方法:本文首先通过实验说明在张量t积的定义下RGB图像的张量低秩结构,并将张量的奇异值定义为相应块对角矩阵的奇异值,借鉴传统矩阵方法对奇异值的加权策略,将TRPCA改造为带有“奇异值”加权的TWRPCA,并给出相应的求解算法,用于小概率稀疏噪声去噪。在合成数据实验中,分别通过张量线性产生以及向量线性产生的低秩三阶张量,在低噪声水平下不同秩的修复结果显示:张量方法以及加权策略都提升了精确修复对秩的“容忍度”。在图像实验中采用Berkeley数据集,TWRPCA在对小概率稀疏噪声恢复性能上超过先进的TRPCA、TLRR,在细节保留上也有较为优异的表现。
其他文献
学位
学位
学位
学位
目的:探讨双源CT双能量技术标准化碘值、电子密度及有效原子序数诊断结直肠癌分化程度的诊断效能;探讨双源CT双能量技术标准化碘值、电子密度及有效原子序数诊断结直肠癌是否浆膜浸润的诊断效能;探讨双源CT双能量技术参数间的相关性。方法:回顾性分析2018年12月至2021年1月在我院临床诊断及病理证实为结直肠癌并且接受西门子双源CT检查的患者102例,其中高分化17例、中分化63例、低分化22例;浆膜浸
学位
学位
学位
学位
学位