论文部分内容阅读
张量分解在图像、数据挖掘等领域有着广泛的研究和应用。现有的张量分解算法,如CANDECOMP/PARAFAC(CP)分解算法和Tucker分解算法等在许多问题的处理中已经得到了很好的应用,但目前仍有一些困难没有得到解决。当CP分解算法应用于特征提取时,如果用户选择不恰当的秩,就会导致特征提取的结果不准确,然而如何选取合适的秩在目前的研究中并没有合适的解决办法。在Tucker分解算法的研究中存在分解结果不唯一的问题,这样的结果可能会使用户感到困惑。因此本文旨在提出一种简单、有效且具有分解唯一性的张量分解算法——层次化张量分解。围绕层次化张量分解的构建及其相关的应用,本文主要进行了以下几个方面的研究工作:1)提出了层次化张量分解(Hierarchical Tensor Decomposition,HTD)的框架,将低秩分解引入到张量分解结构中。其分解结果唯一,结构简单,且能适用于多种低秩分解的融合。2)在层次化张量分解的框架下,提出了基于层次化奇异值分解的张量分解方法(Hierarchical Singular Value Decomposition,HSVD),并将这种方法与现有张量分解方法进行实验对比。大量的实验结果表明,HSVD分解算法可以在最小均方误差较小的情况下对张量进行有效地分解和重构。与CP分解算法相比,HSVD分解算法受到张量秩的影响较小。另外,与Tucker分解算法相比较,HSVD分解的结果可以获得与Tucker分解结果相似的特性,但HSVD分解的时间复杂度相对要低得多。此外,研究发现HSVD分解算法对数据变换具有不敏感性,即当一个维度中数据点的顺序发生变化时,其他维度之间分解的特征不受影响。实验结果还表明,HSVD分解算法在表情明显不同的真实人脸数据以及ORL数据集上表现良好。3)在层次化张量分解的框架下,提出了基于层次化非负矩阵分解的张量分解方法(Hierarchical Nonnegative Matrix Factorization,HNMF)。通过实验证明,与CP分解等算法对比,在选择合适维度的情况下,HNMF分解算法具有更好的去噪效果,并且在能够提取出更多更清晰的数据特征。4)针对张量分解算法的测试问题,设计了两种人工合成数据:具有符合高斯分布特征的光斑数据和具有明显视觉特征的宫格数据。这两种人工合成数据既可以模拟真实数据的分布,又具有清晰的视觉特征,可以准确有效的测试算法在获取主轴方向、特征提取方面的性能。