论文部分内容阅读
发展新的实验设计与分析方法,通过实施少量实验,优化配方并解释各因素效应,对发酵工程、动植物营养、工艺流程优化等多因素多水平实验设计意义重大。正交设计与均匀设计(UD)特别是后者能有效降低实验个数,但其后续分析常采用的多元线性回归、偏最小二乘回归、二次多项式回归、人工神经网络、响应面方法等经验风险最小回归模型存在诸多弊端,特别是其假定样本充分大或无限大,而配方优化是典型的小样本,因此其泛化推广能力在小样本前提下较差:由经验风险最小回归模型推测的最优配方,在验证中往往发现不是满意配方。支持向量机(SVM)是机器学习领域的集大成者,包括支持向量分类(SVC)和支持向量回归(SVR),它基于结构风险最小,较好地解决了小样本、非线性、过拟合、维数灾和局极小等问题,泛化推广能力优异,但可解释性差。结合均匀设计(UD)与支持向量回归(SVR),提出了一种新的多因素多水平实验设计与分析新方法:UD-SVR,并在7个独立实验中验证了新方法的有效性,均明显优于二次多项式偏最小二乘回归等经验风险最小参比模型(袁哲明等,2009;李俊等,2010;蔡柳等,2010;周世豪等,2012);另接受委托优化任务在研5项。进一步,基于F测验,对SVR建立了一套完整的非线性解释性体系,包括模型回归显著性测验、单因子重要性显著性测验、单因子效应及灵敏度分析、两因子互作显著性测验等,并验证了新解释性体系的合理性与有效性(谭显胜等,2009)。以棉铃虫半纯人工饲料配方优化为例,考虑6因素时仅通过2轮22个实验,表征配方优劣的指标——平均蛹重,由初始的0.243 6g高效提升至0.304.4g,并确证了我们提出的非线性解释性体系的合理性与优越性(李俊等,2010);在此基础上,进一步添加了3种微量物质,平均蛹重现已提升到0.35g。UD-SVR为多因素多水平实验设计与分析提供了一套预测精度高、指导性强、可解释性好、优化高效的整体解决方案,应用前景广泛。