论文部分内容阅读
支持向量机是一种基于统计学习理论的机器学习方法,在解决小样本、非线性及高维模式识别中表现出许多特有的优势,已在各个领域得到广泛应用,但在林下参光环境领域中的应用研究尚未见报道。作为在支持向量机中起着决定性作用的核函数,已引起国内外学者关注,构建新型核函数成为其研究热点之一。通过研究自然界中一些自然现象而总结出的仿生智能优化算法,能够可靠解决全局最优化问题,且这些优化算法具有普遍适应性。支持向量机中的参数优化程度影响着构建模型的预测精度和泛化能力,将仿生智能算法用于参数优化过程,可寻找出最佳的预测模型。林下资源是人类宝贵的物质资源,人参是最重要的林下资源之一,其作为阴性植物,对生态环境提出了很高的要求,尤其是对光环境极具敏感性。本研究瞄准本领域的科技发展前沿,选取林下种植生态环境中重要的自然光环境问题,设计了一种人性化、便于日后扩展其他功能的光照强度监控系统;以生态系统的物理和生物学原理为基础,利用系统分析和机器学习方法,建立林下参种植的自然光环境动态模型。本文的主要研究内容和结论如下:(1)构造了新型核函数。研究核函数原理,分析常见核函数中高斯核函数多项式核函数和感知器核函数的性能,采用高斯核函数和多项式核函数为基准核函数,构造核函数并对各构造核函数进行性能分析。通过特征曲线分析得知,高斯核函数具有较强的局部学习能力,并且参数γ影响决策函数的判断能力:γ值变大,则训练集中的支持向量增多,模型泛化能力下降,γ过大会导致过学习现象;γ值变小,训练集中样本被错误分类的机率增大,γ过小会导致欠学习现象。多项式核函数具有较强的全局学习能力,d值的增加会增强该能力。感知器核函数兼顾局部学习能力和全局学习能力,从其特称曲线得知,该核函数的局部学习能力较强,而全局学习能力较弱,可以通过减小p值可以增加其全局学习能力,但同时局部学习能力相应减弱。采用式K(x, x’)=K1(x,x’)+K2(x, x’方式构造的核函数K(x,xi),兼备局部学习能力和全局学习能力,其局部学习能力完全由高斯核函数K1(x,xi)决定,全局学习能力则完全由多项式核函数K2(x,xi)决定。采用式K(x, x’)=λK*(x, x’)方式构造的核函数K(x,xi),其性能完全取决于基准函数的特性,若基准核函数采用K1(x,xi),则K(x,xi)仅改善局部学习能力;若基准核函数采用K,(x,xi),则K(x,xi)仅改善全局学习能力;采用式K(x,x’)=Kx(x,x’)K2(x,x’)方式构造的核函数K(x,xi),特征曲线变化规律与K1(x,xi)的相类似,呈现出局部学习能力强,全局学习能力弱的特点。通过调节K1(x,xi)和K2(x,xi)的参数,仅对K(x,xi)的局部学习能力有所改善,而对全局学习能力影响甚微。采用式构造的核函数,可以通过调节ai(i=1,2)值达到调节其局部学习能力和全局学习能力的目的。(2)构建了新型仿生智能算法——追踪算法。利用Needle-in-a-haystack函数和Schaffer函数检验遗传算法、粒子群算法和追踪算法的全局寻优能力Needle-in-a-haystack函数,在区间-5≤x≤5,-5≤y≤5范围内有全局最小值f(0,0)=-3600,对于Schaffer函数,在区间-20≤x≤20,-20≤y≤20,i=1,2范围内有全局最小值f(0,0)=0,遗传算法取个体数目为20,最大遗传代数为200,变量的二进制位数为25,交叉概率为0.9,变异概率为0.08,对于Needle-in-a-haystack函数,经过遗传代数为40代以后,最佳适应度值趋于全局最优解-3600,对于Schaffer函数,经过遗传代数为20代以后,最佳适应度值陷入局部最优解0.085;粒子群算法取进化代数为200,种群规模为20,对于Needle-in-a-haystack函数,经过进化代数为10代以后,最佳适应度陷入局部最优解-2500,对于Schaffer函数,经过进化代数为60代以后,最佳适应度趋于全局最优解0;追踪算法取种群规模为200,个体追踪路程为20,对于Needle-in-a-haystack函数,经过搜索代数为20代以后,最佳适应度趋于全局最优解-3600,对于Schaffer函数,经过搜索代数为20代以后,最佳适应度趋于全局最优解0。(3)利用TSL2561对可见光敏感特性,ATMega16L具备I2C和SPI总线功能,采用主机-从机架构,结合上位机监控软件,设计了林下参光照强度实时监控系统。本系统采用单个主机、多个从机的SPI总线连接方式,使得主从机传输距离达到1000m,为今后更方便增加试验单位监控点提供保障。该方法简单易行且光照强度传输数据受外界因素干扰小,适用于林下参光环境中所要测量的光照强度区域较大的特点。将各从机与TNHY-9监测仪放入标准光照环境中,测试光照强度。在数据传输过程中,加入校验码以确保数据传输可靠性,加入从机编号以区分林下基地不同试验单位。主-从机传输距离为500m时,除5号从机所测得光照强度值为341lux外,其余从机所测值均为340lux,其方差为8.5。主-从机传输距离增加为1000m时,各从机所得光照强度开始变化,其方差为11.5。可见,主-从机传输距离的增加使得该系统性能有所下降,但从整体看,系统主-从机传输距离不超过1000m时,本系统对光照强度数据传输具备相当可靠性。本研究构建的实时监测软件可以根据林下光环境及对光照强度测量精度的要求,调整采样频率,为林下光环境数据的测量提供了新方法。(4)本研究利用支持向量机建立预测模型,通过可见光光谱组成成分配比关系,预测个体净光合速率(Pn),通过直射辐射(PFDdir)和散射辐射(PFDdif)预测光合有效辐射(PAR),为林下光环境的预测和评价提供了新方法。采用epsilon-SVR公式,nu-SVR公式,linear核函数(K1),polynomial核函数(K2),radial basis function核函数(K3),核函数(ai≥0且核函数,K1K3核函数,K2K3核函数,K1K2K3核函数,惩罚参数c和gamma值采用grid-search,遗传算法,粒子群算法和追踪算法进行参数寻优,以上多种组合建立不同的支持向量模型,在加入其他影响因素的ε粒子后,经进行交叉试验,NRTA模型为预测Pn的最优模型,对2011年8月14日至8月28日的Pn拟合程度为90.903%;EGSK(0.1,0,0.9)模型为预测PAR的最优模型,对2010年7月21日~7月30日的PAR拟合程度为86.897%。