论文部分内容阅读
叶绿素a是水体浮游水生生物的重要组成部分,并且它在浮游生物中的含量比较固定,方便在检测室测量,因此通常利用Chla作为监测水体生物量和营养化程度的指标。Chla浓度反演模型的研究也成为水色遥感研究的重要领域,通过对Chla浓度的计算反演,可以得出湖泊中的各区域初级生产力的状况,进而得到水体的富营养化程度。传统湖泊叶绿素含量监测耗时耗力,而且难以得到区域叶绿素分布结果。随着遥感技术和机器学习技术的不断发展,这两者的结合为实现大面湖泊水质高效、低成本监测提供了一种全新的方法。本文把太湖选为研究区域,以太湖地区叶绿素a浓度实测数据及同期HJ1B星CCD传感器的遥感影像为基础,采用传统经验模型和不同机器学习方法进行太湖叶绿素a浓度反演。通过对不同模型反演结果精度的分析比较,得出适用于内陆湖泊水体监测的反演方法。本文主要工作及结论如下:(1)太湖叶绿素a浓度模型的建立。基于HJ1B-CCD数据和叶绿素a采样点数据,分别利用一元线性模型、多元线性逐步回归模型等两种传统统计模型和K-NN、SVM、RF等三种机器学习算法进行太湖Chla浓度建模,并详细阐述各模型原理、构建过程。(2)太湖叶绿素a浓度反演模型精度对比分析。利用IDL语言进行一元线性模型和多元线性回归模型的留一法交叉验证分别得到R~2=0.55、RMSE=0.007mg/L,R~2=0.72、RMSE=0.007mg/L。分别针对三种不同的机器学习方法进行参数设置,得到K-NN最邻近法的最优K值为4,随机森林决策树取值为600。最终得到K-NN最邻近法、支持向量机、随机森林反演模型的R~2=0.76、RMSE=0.0054mg/L,R~2=0.80、RMSE=0.0050mg/L,R~2=0.88、RMSE=0.0036mg/L。利用留一法交叉验证,使用均方根误差评价各个模型的精度,最大程度的排除随机分配训练样本和检验样本带来的误差和不确定性。实验结果表明,一元线性模型估测精度最低,多元线性逐步回归模型次之,随机森林估测精度最高;k最近邻法和支持向量机估测精度较为接近。