论文部分内容阅读
N阶张量是数据在高维上的扩展。近来,张量的研究因为现代计算能力的支撑变得越来越流行。张量可以被广泛应用在能够被呈现为多维数据的领域内。张量的早期应用是在心理测验学和化学计量学中。随着研究的发展,张量越来越多的被应用在更多的领域,如计量经济学,(生物医学的)信号处理,图像处理,图表分析,数据挖掘等。张量分解在研究数据分析方面非常有用,因为它揭示了张量的低维表示方法。现存应用比较广泛的张量分解方法为Tucker分解和Canonic Polyadic(CP)分解。在低秩矩阵恢复这个重要的问题中,利用凸松弛已被证明是一个非常有价值的方法。近来,这种方法被推广到张量和凸多线性估计的应用中,如张量填充。一些文献更进一步的讨论了凸优化可以被应用到解决在能够在直推学习和归纳学习中发现的更广泛的问题中。解决估测丢失数据问题的重点在于怎样建立已知数据和未知数据的关系。低秩逼近被证明为一个非常强大的解决估计丢失数据问题的方法。但秩作为一个非凸函数使得求解以秩为约束条件的最小化问题成为一个难以解决的NP难题。矩阵的核范数作为矩阵秩的逼近值使得此问题转化为凸优化问题。矩阵的核范数还被证明为矩阵秩的最紧凸逼近。张量的核范数被定义为矩阵核范数的推广。但是,最紧凸逼近的结论在张量时并不成立。据我们所知,张量秩的凸逼近问题仍然是一个未解决的问题。
本论文的主要内容为根据PARAFAC模型定义了一种新的张量范数。意在将其应用到张量填充中,作为张量秩约束的凸松弛。另外总结了张量填充现有的解决方法和解决张量填充问题所用到的交替方向法。进一步分析了文章[1]第一种提议中观测数据的秩和实验结果的关系。主要讨论了张量的不同模秩与张量的低秩恢复的关系。文章的结构如下,第一章主要介绍了本课题的研究背景和为什么要研究张量。第二章先主要概述了张量的基本性质,包括张量的基本结构,张量与向量,矩阵和张量的乘积,张量矩阵化以及张量的分解,秩和范数。在本章中,定义了新的范数,并对其进行了证明。第三章讨论了张量的填充问题。包括问题的引入,已有的张量填充的方法,以及我们利用新定义的范数构成的新的张量填充模型。第四章为数值结果。在分析文章第一种提议中观测数据的秩和实验结果关系的时候,通过改变文献中的代码,计算出观测数据的秩和张量低秩的好坏没有必然的联系。填充效果主要还是在于被还原的张量的秩。最后,在第五章中进行了总结。