论文部分内容阅读
摘 要:为探讨实际应用中高光谱技术快速准确获取农作物叶片含水量,本文以拔节期冬小麦含水量为研究对象,对冬小麦原始光谱进行三种光谱变换处理,采用双波段光谱指数和竞争性自适应重加权采样(Competitive Adaptive Reweighted Sampling, CARS)获取高光谱数据中与LWC高度相关的波段组合,进行多种LWC建模并对比预测精度。结果表明:由CARS筛选的波段组合压缩率达98%以上,结合偏最小二乘回归(Partial Least Squares Regression, PLSR)构建的含水量预测模型拟合精度最高,所建模型中最高预测决定系数为0.8441,模型预测精度均高于以双波段组合所建模型的预测精度。CARS在筛选与冬小麦叶片含水量相关的光谱波段组合方面较为适用,可为估算冬小麦种植区干旱情况和水分管理提供技术支持。
关键词:冬小麦;叶片含水量;高光谱技术;竞争性自适应重加权采样算法
中图分类号:S512.1;S314 文献标识码:A 文章编号:1673-260X(2021)07-0022-05
引言
作物含水量是体现作物生长状况的重要品质指标,直接影响作物对光能的利用和营养供给水平,最终影响其生长质量、品质及产量[1]。冬小麦在中国国民饮食結构中占主导地位,对高产稳产有着重要意义。传统的烘干法检测精度较高,但难以满足生产实践中对大范围冬小麦含水量实时、无损的检测需求,且存在时效性差、有损检测等弊端[2]。遥感技术为冬小麦含水量的动态无损监测提供了新的技术手段,其中高光谱分析技术具有快速、高效、无损的优点,能够获取丰富的地物光谱信息,估算作物生化参数进而诊断其健康状态[3]。
相对于其他遥感技术,高光谱遥感属于前沿领域,具有波段数目多、精度高等特点。国内外学者针对高光谱技术的在农业方面的应用开展了大量研究。如王玉娜等[4]利用FD-SPA建模获取了多个时期冬小麦生物量与高光谱数据的响应关系,模型预测决定系数达0.78,得出抽穗期是估算冬小麦地上部生物量的较佳生育时期。任怡等[5]采用CARS算法对香葱含水量和叶绿素含量的高光谱敏感变量优选,压缩率达3.24%和1.78%,采用偏最小二乘法和支持向量回归建立了定量分析模型,预测决定系数达0.9046和0.9143。
本研究以淮南阜阳地区拔节期冬小麦为实验材料,通过对冬小麦高光谱数据和含水量的测定,采用原始光谱(Original Spectrum, OS)和一阶导数(First Derivative, FD)、二阶导数(Seconder Derivative,SD)和多元散射校正(Multiplicative Scatter Correction, MSC)处理后的共4种光谱数据形式,采用差值光谱指数(Difference Spectral Index,DSI)、比值光谱指数(Ratio Spectral Index, RSI)、归一化光谱指数(Normalized Spectral Index, NDSI)、竞争性自适应重加权采样(Competitive Adaptive Reweighted Sampling, CARS)共四种波段筛选方法获取与叶片含水量(Leaf Water Content, LWC)高度相关的波段组合,结合支持向量回归(Support Vector Regression,SVR)、BP神经网络和偏最小二乘回归(Partial Least Squares Regression, PLSR)建立波段组合和含水量的关系模型,对比分析预测精度,以期为实际应用中高光谱技术获取作物含水量提供技术支持。
1 材料与方法
1.1 研究区概况
研究区位于安徽省阜阳市颍上县谢桥镇(东经115°56′-116°38′、北纬32°27′-32°4′)。该地区属于北温带与亚热带之间过渡型气候,地势平坦,土壤肥沃;主要分布的土地类型为砂礓黑土;主要种植小麦、稻谷、玉米等作物,该地区是“农业绿色发展先行先试支撑体系建设试点县”。选择该地为研究区域,是考虑到该地的土壤和降水条件,且该地区小麦种植产量超过农作物总产量的一半,有着丰富的小麦资源和适宜的实验条件。
1.2 光谱数据获取
2019年4月15日,在当地小麦拔节期分多次采集光谱数据,采样时间为10:30—13:30,测量时天气晴朗,采用ASD FieldSpec4便携式地物光谱仪共采集96组冬小麦冠层高光谱数据。仪器波长范围为350~2500nm,其中350~1000nm波长的采样间隔为1.4nm,1000~2500nm波长的采样间隔为2nm,每个样本测得30条光谱,剔除异常光谱后取平均值作为该样本的光谱,每组数据采样前均进行标准白板校正。
1.3 样本采集与测试
在对应光谱测定位置选取10-15株小麦连根拔起,装入取样袋后迅速运回实验室。在实验室分离出叶片和茎,并称取其饱和鲜重,放入烘箱105℃杀青1h后放置于75℃下烘干至恒重,测定干重。叶片含水量(Leaf Water Content,LWC)的计算公式如下:
式中,FWleaf和DWleaf分别表示叶片鲜重和干重(g)。表1为冬小麦样本中叶片含水量的统计特征。
1.4 光谱数据处理
利用ViewSpecPro对采集的光谱数据进行处理,保留与LWC相关性较高的400~1350nm波段、1400~1800nm波段和1950~2400nm波段[6]。采用MATLAB 2017a软件对OS进行预处理,并利用Origin 2019b软件制图。预处理包括FD、SD和MSC[7,8]。预处理结果如图1所示。图1(a)展示了拔节期冬小麦样品的原始反射光谱曲线。光谱曲线有明显的绿色植物的轮廓特征。 1.5 数据分析方法
光谱指数被认为是增强植被光谱信息的重要方法。其中最常见的形式是RSI、DSI和NDSI[9]。在数据范围内,组合任意两波段构成双波段光谱指数,建立估算模型。
其中Rλ1和Rλ2分别为λ1和λ2两个波段对应的光谱反射率。
1.6 CARS竞争性自适应重加权采样算法
CARS是以达尔文进化论的“适者生存“为指导理论,采用蒙特卡洛采样以及偏最小二乘回归法的特征波段优选方法。CARS法的每个采样周期可分为4个连续的步骤[12,13]:首先采用蒙特卡洛采样法从校正集中选取样本,进行PLSR建模;然后计算波段回归系数的绝对值权重,经衰减指数法计算后,剔除绝对值较小的波段变量;接着采用自适应加权算法在剩余波段变量中选取波段,进行PLSR建模;最后选取交叉验证的均方根误差最小的模型对应的波段变量作为选择的特征波段变量。
1.7 模型构建与精度检验
采用SVR、BP神经网络和PLS建立光谱数据与叶片含水量的预测模型,由决定系数R2、均方根误差RMSE作为模型精度评价指标。其中,R2越大估算效果越好;RMSE越小,模型估算效果越好,反之则越差。
2 结果与讨论
2.1 双波段植被指数回归建模
基于OS、FD、SD和MSC构建的双波段光谱指数与叶片含水量的等势图进行敏感波段组合筛选如图2所示,等势图中每个坐标x和y分别对应λ1和λ2波段,坐标值对应于与叶片含水量的相关系数。模型预测结果汇总于表2。
图2和表2显示,同一光谱变换处理后的数据所建立的高光谱指数等势图类似,相同敏感波段组合下,RSI与LWC的相关系数高于NDSI与LWC的相关系数。对比不同光谱处理类型可知,MSC处理后光谱所建模型的R2较为稳定。OS的敏感波段组合主要分布2180~2390nm;FD的敏感波段组合主要分布在2050~2390nm;SD的敏感波段组合主要分布在2050~2390nm以及900~1300nm;MSC的敏感波段组合主要分布在1420~1430nm。
由表2可知,拔节期中OS-DSI-PLSR模型预测精度最高,R2为0.7987,RMSE为1.7689%。
2.2 CARS法筛选特征波段组合
基于CARS算法提取冬小麥LWC反演模型的特征波段的运行过程如图3所示。由于CARS随着采样次数的不同呈现不同的运算结果,所以本文通过设定不同的采样次数后分别进行运算以选取相对较优的波段变量组合[14]。
如图3所示,采样次数较少时,由于衰减指数的作用,CARS法选取的波段变量数在较短时间内由总波段变量数快速下降到较低水平,随着采样次数增加,选取变量数的降低幅度减缓,交叉验证均方根误差呈现出下降与上升交替进行的趋势,图中“*”竖线标出最小RMSECV值对应的采样次数,为欠拟合与过拟合的交汇点,故选取该点处的最优波段。“*”竖线之后RMSECV开始增大,是由于有效变量被删除了。以OS为例,在OS-CARS中最终选取了1411、1412、1424、1425、1426、1427、1959、2020、2021、2064、2071、2176、2177、2190、2207、2208、2259、2260、2261、2306、2316、2317、2334、2335、2338、2351、2358、2377、2385、2391、2395、2400共32个特征波段用于LWC的预测。选取总量分别仅占全波段总数的1.77%。
结合表2、表3,对比不同方法可知,CARS与提取了有效波段,剔除了无效信息,降低了模型的复杂度,避免了高光谱数据建模中有效信息“丢失”问题,表明CARS在筛选与冬小麦叶片含水量相关的光谱波段组合方面较为适用。
3 结论
本研究对拔节期的冬小麦同步进行了高光谱数据采集和叶片含水量测定,对获取的高光谱数据进行了光谱变换和特征波段提取,通过分析得出以下结论:
(1)与冬小麦叶片含水量相关的波段主要集中在900~1300nm、1420nm~1430nm和2050~2390nm。
(2)由双波段指数和优选波段组合偏最小二乘构建的模型预测精度高于支持向量回归和BP神经网络回归,其中拔节期冬小麦叶片含水量的最佳估测模型为FD-CARS-PLSR。
(3)CARS算法有效减少了建模所需变量数,提取的特征波段主要分布在1410~1430nm、1950~2400nm,使用低于总波段数2%的光谱数据获得了很好的建模效果,极大降低了数据冗余度,所建拔节期冬小麦叶片含水量估算模型的预测决定系数达0.8441。
参考文献:
〔1〕Peng Z, Lin S, Zhang B, et al. Winter Wheat Canopy Water Content Monitoring Based on Spectral Transforms and "Three-edge" Parameters[J]. Agricultural Water Management,2020, 240:106306.
〔2〕刘晓静,陈国庆,王良,等.不同生育时期冬小麦叶片相对含水量高光谱监测[J].麦类作物学报,2018,38(07):854-862.
〔3〕王纪华,赵春江,郭晓维,等.用光谱反射率诊断小麦叶片水分状况的研究[J].中国农业科学,2001, 40(01):104-107.
〔4〕王玉娜,李粉玲,王伟东,等.基于连续投影算法和光谱变换的冬小麦生物量高光谱遥感估算[J].麦类作物学报,2020,40(11):1389-1398.
〔5〕任怡,王成全,Bonah Ernest,等.高光谱成像技术预测香葱贮藏品质研究[J/OL].食品工业科技:1-15[2021-04-03]. 〔6〕陈秀青,杨琦,韩景晔,等.基于叶冠尺度高光谱的冬小麦叶片含水量估算[J].光谱学与光谱分析,2020,40(03):891-897.
〔7〕第五鹏瑶,卞希慧,王姿方,等.光谱预处理方法选择研究[J].光谱学与光谱分析,2019,39(09):2800-2806.
〔8〕张东辉,赵英俊,秦凯,等.光谱变换方法对黑土养分含量高光谱遥感反演精度的影响[J].农业工程学报,2018,34(20):141-147.
〔9〕王伟东,常庆瑞,王玉娜.基于UHD185成像光谱仪的冬小麦叶绿素监测[J].干旱区研究,2020,37(05):1362-1369.
〔10〕Galv?觓o, R K Harrop, Araújo, et al. Cross-validation for the selection of spectral variables using the successive projections algorithm[J]. Journal of the Brazilian Chemical Society,2007,18(08).
〔11〕MCU Araújo, T C B Saldanha, R K H Galv?觓o, et al. The successive projections algorithm for variable selection in spectroscopic multicomponent analysis[J].Chemometrics and Intelligent Laboratory Systems, 2001, 57(02).
〔12〕H D Li, Y Z Liang, Q S Xu, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Analytica Chimica Acta,2009,648(01).
〔13〕D Wu, D W Sun. Potential of time series-hyperspectral imaging (TS-HSI) for non-invasive determination of microbial spoilage of salmon flesh[J]. Talanta,2013,111.
〔14〕王海龍,杨国国,张瑜,等.竞争性自适应重加权算法和相关系数法提取特征波长检测番茄叶片真菌病害[J].光谱学与光谱分析,2017,37(07):2115-2119.
关键词:冬小麦;叶片含水量;高光谱技术;竞争性自适应重加权采样算法
中图分类号:S512.1;S314 文献标识码:A 文章编号:1673-260X(2021)07-0022-05
引言
作物含水量是体现作物生长状况的重要品质指标,直接影响作物对光能的利用和营养供给水平,最终影响其生长质量、品质及产量[1]。冬小麦在中国国民饮食結构中占主导地位,对高产稳产有着重要意义。传统的烘干法检测精度较高,但难以满足生产实践中对大范围冬小麦含水量实时、无损的检测需求,且存在时效性差、有损检测等弊端[2]。遥感技术为冬小麦含水量的动态无损监测提供了新的技术手段,其中高光谱分析技术具有快速、高效、无损的优点,能够获取丰富的地物光谱信息,估算作物生化参数进而诊断其健康状态[3]。
相对于其他遥感技术,高光谱遥感属于前沿领域,具有波段数目多、精度高等特点。国内外学者针对高光谱技术的在农业方面的应用开展了大量研究。如王玉娜等[4]利用FD-SPA建模获取了多个时期冬小麦生物量与高光谱数据的响应关系,模型预测决定系数达0.78,得出抽穗期是估算冬小麦地上部生物量的较佳生育时期。任怡等[5]采用CARS算法对香葱含水量和叶绿素含量的高光谱敏感变量优选,压缩率达3.24%和1.78%,采用偏最小二乘法和支持向量回归建立了定量分析模型,预测决定系数达0.9046和0.9143。
本研究以淮南阜阳地区拔节期冬小麦为实验材料,通过对冬小麦高光谱数据和含水量的测定,采用原始光谱(Original Spectrum, OS)和一阶导数(First Derivative, FD)、二阶导数(Seconder Derivative,SD)和多元散射校正(Multiplicative Scatter Correction, MSC)处理后的共4种光谱数据形式,采用差值光谱指数(Difference Spectral Index,DSI)、比值光谱指数(Ratio Spectral Index, RSI)、归一化光谱指数(Normalized Spectral Index, NDSI)、竞争性自适应重加权采样(Competitive Adaptive Reweighted Sampling, CARS)共四种波段筛选方法获取与叶片含水量(Leaf Water Content, LWC)高度相关的波段组合,结合支持向量回归(Support Vector Regression,SVR)、BP神经网络和偏最小二乘回归(Partial Least Squares Regression, PLSR)建立波段组合和含水量的关系模型,对比分析预测精度,以期为实际应用中高光谱技术获取作物含水量提供技术支持。
1 材料与方法
1.1 研究区概况
研究区位于安徽省阜阳市颍上县谢桥镇(东经115°56′-116°38′、北纬32°27′-32°4′)。该地区属于北温带与亚热带之间过渡型气候,地势平坦,土壤肥沃;主要分布的土地类型为砂礓黑土;主要种植小麦、稻谷、玉米等作物,该地区是“农业绿色发展先行先试支撑体系建设试点县”。选择该地为研究区域,是考虑到该地的土壤和降水条件,且该地区小麦种植产量超过农作物总产量的一半,有着丰富的小麦资源和适宜的实验条件。
1.2 光谱数据获取
2019年4月15日,在当地小麦拔节期分多次采集光谱数据,采样时间为10:30—13:30,测量时天气晴朗,采用ASD FieldSpec4便携式地物光谱仪共采集96组冬小麦冠层高光谱数据。仪器波长范围为350~2500nm,其中350~1000nm波长的采样间隔为1.4nm,1000~2500nm波长的采样间隔为2nm,每个样本测得30条光谱,剔除异常光谱后取平均值作为该样本的光谱,每组数据采样前均进行标准白板校正。
1.3 样本采集与测试
在对应光谱测定位置选取10-15株小麦连根拔起,装入取样袋后迅速运回实验室。在实验室分离出叶片和茎,并称取其饱和鲜重,放入烘箱105℃杀青1h后放置于75℃下烘干至恒重,测定干重。叶片含水量(Leaf Water Content,LWC)的计算公式如下:
式中,FWleaf和DWleaf分别表示叶片鲜重和干重(g)。表1为冬小麦样本中叶片含水量的统计特征。
1.4 光谱数据处理
利用ViewSpecPro对采集的光谱数据进行处理,保留与LWC相关性较高的400~1350nm波段、1400~1800nm波段和1950~2400nm波段[6]。采用MATLAB 2017a软件对OS进行预处理,并利用Origin 2019b软件制图。预处理包括FD、SD和MSC[7,8]。预处理结果如图1所示。图1(a)展示了拔节期冬小麦样品的原始反射光谱曲线。光谱曲线有明显的绿色植物的轮廓特征。 1.5 数据分析方法
光谱指数被认为是增强植被光谱信息的重要方法。其中最常见的形式是RSI、DSI和NDSI[9]。在数据范围内,组合任意两波段构成双波段光谱指数,建立估算模型。
其中Rλ1和Rλ2分别为λ1和λ2两个波段对应的光谱反射率。
1.6 CARS竞争性自适应重加权采样算法
CARS是以达尔文进化论的“适者生存“为指导理论,采用蒙特卡洛采样以及偏最小二乘回归法的特征波段优选方法。CARS法的每个采样周期可分为4个连续的步骤[12,13]:首先采用蒙特卡洛采样法从校正集中选取样本,进行PLSR建模;然后计算波段回归系数的绝对值权重,经衰减指数法计算后,剔除绝对值较小的波段变量;接着采用自适应加权算法在剩余波段变量中选取波段,进行PLSR建模;最后选取交叉验证的均方根误差最小的模型对应的波段变量作为选择的特征波段变量。
1.7 模型构建与精度检验
采用SVR、BP神经网络和PLS建立光谱数据与叶片含水量的预测模型,由决定系数R2、均方根误差RMSE作为模型精度评价指标。其中,R2越大估算效果越好;RMSE越小,模型估算效果越好,反之则越差。
2 结果与讨论
2.1 双波段植被指数回归建模
基于OS、FD、SD和MSC构建的双波段光谱指数与叶片含水量的等势图进行敏感波段组合筛选如图2所示,等势图中每个坐标x和y分别对应λ1和λ2波段,坐标值对应于与叶片含水量的相关系数。模型预测结果汇总于表2。
图2和表2显示,同一光谱变换处理后的数据所建立的高光谱指数等势图类似,相同敏感波段组合下,RSI与LWC的相关系数高于NDSI与LWC的相关系数。对比不同光谱处理类型可知,MSC处理后光谱所建模型的R2较为稳定。OS的敏感波段组合主要分布2180~2390nm;FD的敏感波段组合主要分布在2050~2390nm;SD的敏感波段组合主要分布在2050~2390nm以及900~1300nm;MSC的敏感波段组合主要分布在1420~1430nm。
由表2可知,拔节期中OS-DSI-PLSR模型预测精度最高,R2为0.7987,RMSE为1.7689%。
2.2 CARS法筛选特征波段组合
基于CARS算法提取冬小麥LWC反演模型的特征波段的运行过程如图3所示。由于CARS随着采样次数的不同呈现不同的运算结果,所以本文通过设定不同的采样次数后分别进行运算以选取相对较优的波段变量组合[14]。
如图3所示,采样次数较少时,由于衰减指数的作用,CARS法选取的波段变量数在较短时间内由总波段变量数快速下降到较低水平,随着采样次数增加,选取变量数的降低幅度减缓,交叉验证均方根误差呈现出下降与上升交替进行的趋势,图中“*”竖线标出最小RMSECV值对应的采样次数,为欠拟合与过拟合的交汇点,故选取该点处的最优波段。“*”竖线之后RMSECV开始增大,是由于有效变量被删除了。以OS为例,在OS-CARS中最终选取了1411、1412、1424、1425、1426、1427、1959、2020、2021、2064、2071、2176、2177、2190、2207、2208、2259、2260、2261、2306、2316、2317、2334、2335、2338、2351、2358、2377、2385、2391、2395、2400共32个特征波段用于LWC的预测。选取总量分别仅占全波段总数的1.77%。
结合表2、表3,对比不同方法可知,CARS与提取了有效波段,剔除了无效信息,降低了模型的复杂度,避免了高光谱数据建模中有效信息“丢失”问题,表明CARS在筛选与冬小麦叶片含水量相关的光谱波段组合方面较为适用。
3 结论
本研究对拔节期的冬小麦同步进行了高光谱数据采集和叶片含水量测定,对获取的高光谱数据进行了光谱变换和特征波段提取,通过分析得出以下结论:
(1)与冬小麦叶片含水量相关的波段主要集中在900~1300nm、1420nm~1430nm和2050~2390nm。
(2)由双波段指数和优选波段组合偏最小二乘构建的模型预测精度高于支持向量回归和BP神经网络回归,其中拔节期冬小麦叶片含水量的最佳估测模型为FD-CARS-PLSR。
(3)CARS算法有效减少了建模所需变量数,提取的特征波段主要分布在1410~1430nm、1950~2400nm,使用低于总波段数2%的光谱数据获得了很好的建模效果,极大降低了数据冗余度,所建拔节期冬小麦叶片含水量估算模型的预测决定系数达0.8441。
参考文献:
〔1〕Peng Z, Lin S, Zhang B, et al. Winter Wheat Canopy Water Content Monitoring Based on Spectral Transforms and "Three-edge" Parameters[J]. Agricultural Water Management,2020, 240:106306.
〔2〕刘晓静,陈国庆,王良,等.不同生育时期冬小麦叶片相对含水量高光谱监测[J].麦类作物学报,2018,38(07):854-862.
〔3〕王纪华,赵春江,郭晓维,等.用光谱反射率诊断小麦叶片水分状况的研究[J].中国农业科学,2001, 40(01):104-107.
〔4〕王玉娜,李粉玲,王伟东,等.基于连续投影算法和光谱变换的冬小麦生物量高光谱遥感估算[J].麦类作物学报,2020,40(11):1389-1398.
〔5〕任怡,王成全,Bonah Ernest,等.高光谱成像技术预测香葱贮藏品质研究[J/OL].食品工业科技:1-15[2021-04-03]. 〔6〕陈秀青,杨琦,韩景晔,等.基于叶冠尺度高光谱的冬小麦叶片含水量估算[J].光谱学与光谱分析,2020,40(03):891-897.
〔7〕第五鹏瑶,卞希慧,王姿方,等.光谱预处理方法选择研究[J].光谱学与光谱分析,2019,39(09):2800-2806.
〔8〕张东辉,赵英俊,秦凯,等.光谱变换方法对黑土养分含量高光谱遥感反演精度的影响[J].农业工程学报,2018,34(20):141-147.
〔9〕王伟东,常庆瑞,王玉娜.基于UHD185成像光谱仪的冬小麦叶绿素监测[J].干旱区研究,2020,37(05):1362-1369.
〔10〕Galv?觓o, R K Harrop, Araújo, et al. Cross-validation for the selection of spectral variables using the successive projections algorithm[J]. Journal of the Brazilian Chemical Society,2007,18(08).
〔11〕MCU Araújo, T C B Saldanha, R K H Galv?觓o, et al. The successive projections algorithm for variable selection in spectroscopic multicomponent analysis[J].Chemometrics and Intelligent Laboratory Systems, 2001, 57(02).
〔12〕H D Li, Y Z Liang, Q S Xu, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Analytica Chimica Acta,2009,648(01).
〔13〕D Wu, D W Sun. Potential of time series-hyperspectral imaging (TS-HSI) for non-invasive determination of microbial spoilage of salmon flesh[J]. Talanta,2013,111.
〔14〕王海龍,杨国国,张瑜,等.竞争性自适应重加权算法和相关系数法提取特征波长检测番茄叶片真菌病害[J].光谱学与光谱分析,2017,37(07):2115-2119.