论文部分内容阅读
机器学习中数据的表示形式非常重要。目前在处理张量型数据时,通常将其转化为向量型数据,这样就会丢失大量的张量结构信息。张量型数据能保留这些结构信息,因而更符合实际情况,基于张量数据的机器学习新方法开始被广泛研究及应用,己成为当今数据挖掘领域的一个新的研究方向,它的理论研究和实际应用正在快速的发展,最优化方法是其主要工具之一。本文以基于向量数据的机器学习方法为基础,从最优化角度研究张量数据的学习问题,特别关注张量数据学习问题的新模型的建立及其最优化算法的设计。本文的研究内容包括以下几个方面:1、通过对现有模型的分析,确定张量学习方法与向量学习方法的关系,进而从几何角度对支持张量机进行了解释。讨论了支持张量机权重张量的特有形式,得到了保持张量结构信息的几种方法,并在此基础上建立了张量学习的新模型--秩约束支持张量机。数值实验表明,这种方法不但能得到理想的分类效果,而且还避免了交替迭代,节约了大量的计算时间。2、为了保持张量的向量因子的相关性,构造了一种新的张量核函数,这种张量核函数能有效地保持张量的结构信息。通过将这种核函数与支持张量机的对偶问题相结合,得到了一种新的处理张量数据的非线性分类方法--加核支持张量机。3、由于欧氏距离是基于正交假设的,因此用欧氏距离来度量矩阵数据间的距离并不是很合理。通过引入矩阵的数量因子的位置关系,得到了一种新的矩阵距离。这种新矩阵距离不但考虑了矩阵数量因子的关系,还能够合理的度量矩阵数据间的距离。这种新矩阵距离可以应用到矩阵分类、降维、回归和聚类等多个领域。4、基于矩阵的新距离和多线性子空间判别分析方法,我们提出了一种新的矩阵降维方法。通过引入反映矩阵稀疏性的L2,1范数,建立了带有稀疏性的支持张量机模型,这种方法不但能实现对数据的降维,还能够实现对数据类别的预测。通过大量的数值实验表明,这两种降维方法具有可行性和有效性。5、通过对基于张量的机器学习方法的全面总结,我们提出了基于张量的机器学习方法的框架。框架指出研究基于张量的机器学习方法实质上就是在寻找一个理想的张量距离度量。