论文部分内容阅读
投影寻踪是通过把高维数据投影到低维空间,寻找能反映原高维数据结构或特征的投影,以达到研究分析高维数据的目的一种探索性分析方法。投影寻踪方法为高维非正态、非线性数据分析提供了新的理论方法,自提出便受到国内外众多学者的关注与讨论,其理论研究发展迅速,应用广泛。因此,本文对投影寻踪模型展开研究,总结概括投影寻踪的基本思想与研究工作,对投影指标函数的选择与构造以及投影方向的优化方法进行讨论研究,提出三类投影寻踪模型并将其应用于高维实际问题的综合评价与预测中,概括为以下几个方面:(1)针对传统投影方向优化方法在处理多变量同时寻优时容易陷入局部最优、早熟或提前收敛的问题,引入一种全局优化算法—粒子群算法,并对该算法进行改进,引入协同机制提出协同粒子群算法,求解多参数耦合优化问题,以提高优化精度与收敛速度。(2)在多因素影响问题的分类与综合评价中,传统方法存在指标权重赋值客观性差、评价结果准确性低的问题。针对该问题,根据评价样本的结构特性或评价标准提出两类投影寻踪聚类分析模型:为凸显评价样本的结构特性选用一维散布和局部密度的积作为投影指标函数,并采用粒子群算法优化,构建粒子群优化的投影寻踪分类模型;为建立投影值与评价标准设置的等级之间的关系,构建投影寻踪插值模型。这两类模型完全依据样本数据特征对多因素影响问题进行分类与综合评价,避免了专家赋权的人为干扰。将其分别应用到水稻灌溉制度评价与土壤质量等级评价中,实例评价结果科学合理,验证了这两类投影寻踪聚类分析模型的准确性与可行性。(3)为解决多元非线性预测问题,将回归分析与投影寻踪思想结合,采用Hermite多项式拟合一维岭函数,构建了基于Hermite多项式的投影寻踪回归模型,并采用协同粒子群算法并行优化投影方向与多项式系数。将该模型应用到年径流预测中,预测结果验证了模型的可行性。同时,与基本粒子群算法和基于实数编码的加速遗传算法进行对比,结果表明在多参数优化问题上,协同粒子群算法具有较好收敛性。(4)针对投影寻踪回归模型在多元非线性预测中存在的过于依赖数据样本与容错能力弱等缺点,引入神经网络结构建立了基于神经网络的投影寻踪耦合模型。同样采用协同粒子群算法并行优化投影方向、神经元函数以及阈值。以水资源承载力预测问题为实例采用该耦合模型与投影寻踪回归模型分别进行预测,预测结果验证了基于神经网络的投影寻踪耦合模型的自学习性与自适应性。