论文部分内容阅读
摘 要:为满足多工序挤出式乳胶丝高效稳定生产需要,基于挤出式乳胶丝关键生产参数,采用多重多元回归、广义回归神经网络(generalized regression neural network,GRNN)与量子遗传算法(quantum genetic algorithm,QGA)分别建立多重多元回归模型、GRNN模型与QGA-GRNN模型,并以均方误差(mean squared error,MSE)作为评价指标在应用中比较3个模型预测效果。应用结果表明:QGA-GRNN模型在应用中能取得更小的MSE,预测能力优于其他两个模型,适用于挤出式乳胶丝产品质量预测。
关键词:乳胶丝;多重多元回归;广义回归神经网络;量子遗传算法
文献标志码:A 文章编号:1674-5124(2016)07-0103-04
Abstract: In order to meet the need of the efficient and stable production of extruded latex thread of multiple procedures, multivariate regression model, GRNN model and QGA-GRNN model, based on the key parameters, were established by using multivariate regression, generalized regression neural network (GRNN) and quantum genetic algorithm (QGA). The mean square error (MSE) is applied as the evaluation index to compare 3 models. The application result indicates that QGA-GRNN model obtains smaller MSE, and its forecasting capacity is superior to the other two models. It is therefore appropriate for extruded latex thread product quality prediction.
Keywords: latex thread; multivariate regression model; GRNN; QGA
0 引 言
乳胶丝因其弹性优良、绝缘性好、拉伸强度高、耐磨性良好等特点,在服装、家具、医用及军事等行业应用广泛且需求量庞大。随着应用领域的快速发展,各行业对乳胶丝性能要求提升明显,乳胶丝行业标准对性能要求却无变化[1],导致乳胶丝性能提升缓慢。采用挤出法制得的乳胶丝因表面光滑且性能较之传统生产工艺有所提升,故广泛被乳胶丝生产企业采用,但其生产过程工艺复杂与控制参数多等又给乳胶丝产品稳定性带来挑战[2]。建立产品质量模型提前预测产品性能是解决复杂工业生产稳定性有效措施,文献[3-5]分别针对水质、活塞环渗氮质量及聚丙烯质量建立模型,以解决生产应用中缺乏的有效质量预测问题。本文通过前期基于MCGS组态平台搭建的监测系统,获取制约乳胶丝性能的关键生产参数,分别采用多重多元回归与GRNN建立乳胶丝质量预测模型。为进一步提高GRNN预测效果,引入QGA优化GRNN参数,形成QGA-GRNN预测模型,并以MSE作为评价指标,于应用中比较多重多元回归、GRNN与QGA-GRNN三者预测效果,最终得到较优模型。
1 数学模型选择
通过研究挤出式乳胶丝生产工艺,确定制约乳胶丝性能的关键生产参数包含胶凝酸碱度pH、胶凝时间tgel、胶凝温度Tgel、清洗时间tclean、清洗温度Tclean、烘干时间tdry、烘干温度Tdry、硫化时间tvul及硫化温度Tvul,基于Modbus和MCGS搭建具备监测及存储这些参数的在线系统,并以300%定伸应力、拉伸强度及拉断伸长率为预测目标,研究采取何种数学模型进行9输入3输出质量建模对预测结果准确与否影响较大。
1.1 多重多元回归
设x1,x2,…,xm为多重多元回归模型的m个自变量,y1,y2,…,yq是与其对应的q个因变量,假设它们之间存在线性关系,则:
根据n组自变量和因变量观测数据,得出系数矩阵β,使得误差阵ε各元素平方和最小,采用最小二乘法可得:
β确定后可得到多重多元回归模型,但该模型是在假设因变量和自变量之间存在线性关系的条件下得出的,因此还需通过检验。检验分为2步,首先确定各因变量残差是否服从或渐进服从正态分布,且残差与因变量拟合值之间不存在相关关系[6];然后采用各因变量的回归平方和U与剩余平方和Q组成统计量F,由F分布检验拟合方程的显著性,其结果应满足:
1.2 广义回归神经网络
对比多重多元回归,神经网络在逼近未知函数,特别是各种非线性函数时,有其独特优势,因此很多学者采用神经网络建立预测模型。
美国学者Donald F.Specht提出的GRNN,对比BP和径向基等经典神经网络,在逼近能力和学习速度上有更大优势,且模型参数简单,适用于非线性函数的建模过程[7]。图1所示为GRNN结构图,网络由输入层、模式层、求和层和输出层构成。
输入层神经元个数与输入向量维数一致,负责将输入向量传递给模式层各个神经元;模式层神经元个数也与输入向量维数一致,其传递函数为
(4)
式中:X——网络输入变量;
Xi——为第i个神经元的学习样本;
σ——光滑因子。 其取值影响网络训练结果,当σ接近0时,样本点预测值与观测值误差会很小,当新的预测点被训练样本包含时,预测结果会很接近,而不被包含时,会产生较大误差,即网络泛化能力不强;因此选取适当的σ使得样本点预测值与观测值误差在可接受范围内,且能较好地适用于其他预测点尤为重要。
求和层神经元分为2类,一类与模式层连接权值为1,其个数为1;另一类与模式层连接权值为输出向量相应的分量,其个数与输出向量维数一致,两者传递函数分别为
输出层神经元个数与输出向量维数一致,其输出结果为
yj=SNj/SD j=1,2,…,q(6)
1.3 量子遗传算法
前面提到光滑因子σ的选取直接影响到GRNN模型预测效果,σ取值范围广,且可选取任意正实数,人为选取很难取到最优σ,使得GRNN模型预测效果最好,因此考虑引进自动寻优算法。
遗传算法(genetic algorithm,GA)只要简单地定义好种群规模、遗传代数、适应度函数、选择函数、交叉和变异操作,就能自动完成目标寻优,但当选择函数、交叉和变异操作定义不当时,会造成GA迭代次数多、易陷入局部极值等现象。
QGA是将量子计算引进GA,利用量子比特实现遗传编码,量子旋转门取代常规GA的交叉和变异操作,而量子旋转门的旋转操作取决于当前种群最优个体,所有个体以最优个体为进化目标[8]。QGA解决了常规GA选择函数、交叉和变异操作的定义不当问题,操作相对常规GA简单,从而更好地实现寻优效果。
2 质量预测模型建立
2.1 数据获取
以胶凝酸碱度pH、胶凝时间tgel、胶凝温度Tgel、清洗时间tclean、清洗温度Tclean、烘干时间tdry、烘干温度Tdry、硫化时间tvul及硫化温度Tvul为预测模型输入量x1,x2,…,x9,300%定伸应力、拉伸强度及拉断伸长率为输出量y1,y2,y3。
建模数据采样自5个批次42#乳胶丝,在各批次生产中每间隔2 h采样一次,总共采样10组数据,因此总共有50组数据。
2.2 模型建立
1)多重多元回归模型
由50组数据组成50×9的输入矩阵X和50×3的输出矩阵Y,假定输出与输入之间存在线性关系,由式(2)可得到多重多元回归的系数矩阵:
系数矩阵β的求解初步确定了多重多元回归模型,但还需通过检验确定输入输出之间是否存在线性关系,以保证模型正确性。
首先通过由β确定的多重多元回归模型与50组数据的输出求得3组因变量残差,通过正态性检验,3组残差均满足正态分布,由残差与其对应拟合值得到的散点图,可知它们之间不存在相关关系,因此初步判定模型正确性。再由式(3)求出3个拟合方程显著性统计量的值,表1所示为F检验结果,从表中可看出,3个方程显著性统计量的值均满足式(3),因此可确定多重多元回归模型的正确性。
2)GRNN模型
在Matlab中,建立GRNN所用函数为newgrnn()。该函数调用格式为
net=newgrnn(P,T,spread)
其中P为输入矩阵X的倒置,T为输出矩阵Y的倒置,spread为前文提到的光滑因子σ,其默认值为1。采用默认spread值,由X、Y和newgrnn()建立GRNN模型,具体步骤如下:
①清空环境变量。
②载入数据X、Y。
③将X、Y倒置,并分别赋给P、T。
④利用函数premnmx()归一化数据。
⑤调用newgrnn()函数建立网络。
3)QGA-GRNN模型
影响GRNN模型预测效果的参数为spread值大小,默认的spread值很难建立最优预测模型。因此引进QGA,通过定义合适的适应度函数寻得最优spread值。
QGA-GRNN训练时设置较为简单,只需确定遗传代数、种群大小、寻优范围和适应度函数即可。本文设置遗传代数为100,种群大小为40,寻优范围先大范围寻优,得到结果后再小范围二次寻优。
从输出矩阵Y知道,300%定伸应力y1的取值范围为[3.00,4.00],拉伸强度y2的取值范围为[15.00,
30.00],拉断伸长率y3的取值范围为[600,800],三者不在同一个数量级,为使GRNN能同时衡量3个因变量预测效果,选用3个因变量相对误差之和的倒数作为适应度函数,即个体的相对误差之和越小,其存活能力越强,图2所示为QGA-GRNN求解最优spread流程图。
根据流程图在Matlab上编写相应程序,得到最优spread值为0.576 82,图3为QGA-GRNN进化过程图,可以看出在45代时已寻得最优值。
3 质量预测模型应用
在获得3个模型后将其应用于实际生产的乳胶丝质量预测中,借此比较3个模型的预测效果。与建模数据一致,同样选取1个批次的42#乳胶丝,在该批次生产中每间隔2 h采样一次,总共采样10组数据。
为衡量3个模型的预测效果,引进MSE作为评价指标,即模型预测值与实测值差值的平方和再除以数据组数,表2所示为3个模型预测效果。
图4所示为3个模型预测效果比较,以300%定伸应力为例解释图形的绘制,以该项目MSE最大值为单位高度,即多重多元回归MSE为单位高度,剩余两个模型高度为相对高度,即其MSE值与最大MSE的比值,同理可得到拉伸强度及拉断伸长率比较图。
从图中可看出QGA-GRNN模型在拉伸强度方面预测能力与GRNN模型相仿,在300%定伸应力和拉断伸长率方面预测能力均优于多重多元回归和GRNN模型,这证明QGA对GRNN的参数寻优是有效的,QGA-GRNN模型更适用于挤出式乳胶丝质量预测。 4 结束语
本文利用工业组态技术获取乳胶丝关键生产参数,采用多重多元回归和广义回归神经网络得到质量预测模型,同时引进量子遗传算法优化广义回归神经网络。应用结果表明,采用量子遗传算法优化的广义回归神经网络能更好地解决复杂乳胶丝生产的最终质量预测问题,可推广到其他多工序或复杂工艺工业产品质量预测建模与应用中。
参考文献
[1] 胶乳胶丝:HG/T 2889—2011[S]. 北京:化工出版社,2012.
[2] 甘木伙,赵均明,陈顺安. 乳胶丝生产工艺:ZL201110068362.0[P]. 2012-05-30.
[3] NAJAH A, EL-SHAFIE A, KARIM O A, et al. Application of artificial neural networks for water quality prediction[J]. Neural Computing and Applications,2013(221):.
[4] 杨杰,刘桂雄. 基于小波Elman神经网络的活塞环渗氮质量预测控制[J]. 华南理工大学学报(自然科学版),2009(2):45-48.
[5] SHI J, LIU X G. Product quality prediction by a neural soft-sensor based on MSA and PCA[J]. International Journal of Automation and Computing,2006,31(1):17-22.
[6] 丁徽,谢健,段文英. 基于多重多元回归的木材干燥质量预测模型[J]. 东北林业大学学报,2012(6):131-133.
[7] SPECHT D F. The general regression neural network-Rediscovered[J]. Neural Networks,1993,6(7):1033-1034.
[8] WANG T, WANG Y, GUO C, et al. Application of QGA-RBF for Predicting the Amount of Mine Gas Emission[J]. Chinese Journal of Sensors & Actuators,2012(1):123-127.
(编辑:徐柳)
关键词:乳胶丝;多重多元回归;广义回归神经网络;量子遗传算法
文献标志码:A 文章编号:1674-5124(2016)07-0103-04
Abstract: In order to meet the need of the efficient and stable production of extruded latex thread of multiple procedures, multivariate regression model, GRNN model and QGA-GRNN model, based on the key parameters, were established by using multivariate regression, generalized regression neural network (GRNN) and quantum genetic algorithm (QGA). The mean square error (MSE) is applied as the evaluation index to compare 3 models. The application result indicates that QGA-GRNN model obtains smaller MSE, and its forecasting capacity is superior to the other two models. It is therefore appropriate for extruded latex thread product quality prediction.
Keywords: latex thread; multivariate regression model; GRNN; QGA
0 引 言
乳胶丝因其弹性优良、绝缘性好、拉伸强度高、耐磨性良好等特点,在服装、家具、医用及军事等行业应用广泛且需求量庞大。随着应用领域的快速发展,各行业对乳胶丝性能要求提升明显,乳胶丝行业标准对性能要求却无变化[1],导致乳胶丝性能提升缓慢。采用挤出法制得的乳胶丝因表面光滑且性能较之传统生产工艺有所提升,故广泛被乳胶丝生产企业采用,但其生产过程工艺复杂与控制参数多等又给乳胶丝产品稳定性带来挑战[2]。建立产品质量模型提前预测产品性能是解决复杂工业生产稳定性有效措施,文献[3-5]分别针对水质、活塞环渗氮质量及聚丙烯质量建立模型,以解决生产应用中缺乏的有效质量预测问题。本文通过前期基于MCGS组态平台搭建的监测系统,获取制约乳胶丝性能的关键生产参数,分别采用多重多元回归与GRNN建立乳胶丝质量预测模型。为进一步提高GRNN预测效果,引入QGA优化GRNN参数,形成QGA-GRNN预测模型,并以MSE作为评价指标,于应用中比较多重多元回归、GRNN与QGA-GRNN三者预测效果,最终得到较优模型。
1 数学模型选择
通过研究挤出式乳胶丝生产工艺,确定制约乳胶丝性能的关键生产参数包含胶凝酸碱度pH、胶凝时间tgel、胶凝温度Tgel、清洗时间tclean、清洗温度Tclean、烘干时间tdry、烘干温度Tdry、硫化时间tvul及硫化温度Tvul,基于Modbus和MCGS搭建具备监测及存储这些参数的在线系统,并以300%定伸应力、拉伸强度及拉断伸长率为预测目标,研究采取何种数学模型进行9输入3输出质量建模对预测结果准确与否影响较大。
1.1 多重多元回归
设x1,x2,…,xm为多重多元回归模型的m个自变量,y1,y2,…,yq是与其对应的q个因变量,假设它们之间存在线性关系,则:
根据n组自变量和因变量观测数据,得出系数矩阵β,使得误差阵ε各元素平方和最小,采用最小二乘法可得:
β确定后可得到多重多元回归模型,但该模型是在假设因变量和自变量之间存在线性关系的条件下得出的,因此还需通过检验。检验分为2步,首先确定各因变量残差是否服从或渐进服从正态分布,且残差与因变量拟合值之间不存在相关关系[6];然后采用各因变量的回归平方和U与剩余平方和Q组成统计量F,由F分布检验拟合方程的显著性,其结果应满足:
1.2 广义回归神经网络
对比多重多元回归,神经网络在逼近未知函数,特别是各种非线性函数时,有其独特优势,因此很多学者采用神经网络建立预测模型。
美国学者Donald F.Specht提出的GRNN,对比BP和径向基等经典神经网络,在逼近能力和学习速度上有更大优势,且模型参数简单,适用于非线性函数的建模过程[7]。图1所示为GRNN结构图,网络由输入层、模式层、求和层和输出层构成。
输入层神经元个数与输入向量维数一致,负责将输入向量传递给模式层各个神经元;模式层神经元个数也与输入向量维数一致,其传递函数为
(4)
式中:X——网络输入变量;
Xi——为第i个神经元的学习样本;
σ——光滑因子。 其取值影响网络训练结果,当σ接近0时,样本点预测值与观测值误差会很小,当新的预测点被训练样本包含时,预测结果会很接近,而不被包含时,会产生较大误差,即网络泛化能力不强;因此选取适当的σ使得样本点预测值与观测值误差在可接受范围内,且能较好地适用于其他预测点尤为重要。
求和层神经元分为2类,一类与模式层连接权值为1,其个数为1;另一类与模式层连接权值为输出向量相应的分量,其个数与输出向量维数一致,两者传递函数分别为
输出层神经元个数与输出向量维数一致,其输出结果为
yj=SNj/SD j=1,2,…,q(6)
1.3 量子遗传算法
前面提到光滑因子σ的选取直接影响到GRNN模型预测效果,σ取值范围广,且可选取任意正实数,人为选取很难取到最优σ,使得GRNN模型预测效果最好,因此考虑引进自动寻优算法。
遗传算法(genetic algorithm,GA)只要简单地定义好种群规模、遗传代数、适应度函数、选择函数、交叉和变异操作,就能自动完成目标寻优,但当选择函数、交叉和变异操作定义不当时,会造成GA迭代次数多、易陷入局部极值等现象。
QGA是将量子计算引进GA,利用量子比特实现遗传编码,量子旋转门取代常规GA的交叉和变异操作,而量子旋转门的旋转操作取决于当前种群最优个体,所有个体以最优个体为进化目标[8]。QGA解决了常规GA选择函数、交叉和变异操作的定义不当问题,操作相对常规GA简单,从而更好地实现寻优效果。
2 质量预测模型建立
2.1 数据获取
以胶凝酸碱度pH、胶凝时间tgel、胶凝温度Tgel、清洗时间tclean、清洗温度Tclean、烘干时间tdry、烘干温度Tdry、硫化时间tvul及硫化温度Tvul为预测模型输入量x1,x2,…,x9,300%定伸应力、拉伸强度及拉断伸长率为输出量y1,y2,y3。
建模数据采样自5个批次42#乳胶丝,在各批次生产中每间隔2 h采样一次,总共采样10组数据,因此总共有50组数据。
2.2 模型建立
1)多重多元回归模型
由50组数据组成50×9的输入矩阵X和50×3的输出矩阵Y,假定输出与输入之间存在线性关系,由式(2)可得到多重多元回归的系数矩阵:
系数矩阵β的求解初步确定了多重多元回归模型,但还需通过检验确定输入输出之间是否存在线性关系,以保证模型正确性。
首先通过由β确定的多重多元回归模型与50组数据的输出求得3组因变量残差,通过正态性检验,3组残差均满足正态分布,由残差与其对应拟合值得到的散点图,可知它们之间不存在相关关系,因此初步判定模型正确性。再由式(3)求出3个拟合方程显著性统计量的值,表1所示为F检验结果,从表中可看出,3个方程显著性统计量的值均满足式(3),因此可确定多重多元回归模型的正确性。
2)GRNN模型
在Matlab中,建立GRNN所用函数为newgrnn()。该函数调用格式为
net=newgrnn(P,T,spread)
其中P为输入矩阵X的倒置,T为输出矩阵Y的倒置,spread为前文提到的光滑因子σ,其默认值为1。采用默认spread值,由X、Y和newgrnn()建立GRNN模型,具体步骤如下:
①清空环境变量。
②载入数据X、Y。
③将X、Y倒置,并分别赋给P、T。
④利用函数premnmx()归一化数据。
⑤调用newgrnn()函数建立网络。
3)QGA-GRNN模型
影响GRNN模型预测效果的参数为spread值大小,默认的spread值很难建立最优预测模型。因此引进QGA,通过定义合适的适应度函数寻得最优spread值。
QGA-GRNN训练时设置较为简单,只需确定遗传代数、种群大小、寻优范围和适应度函数即可。本文设置遗传代数为100,种群大小为40,寻优范围先大范围寻优,得到结果后再小范围二次寻优。
从输出矩阵Y知道,300%定伸应力y1的取值范围为[3.00,4.00],拉伸强度y2的取值范围为[15.00,
30.00],拉断伸长率y3的取值范围为[600,800],三者不在同一个数量级,为使GRNN能同时衡量3个因变量预测效果,选用3个因变量相对误差之和的倒数作为适应度函数,即个体的相对误差之和越小,其存活能力越强,图2所示为QGA-GRNN求解最优spread流程图。
根据流程图在Matlab上编写相应程序,得到最优spread值为0.576 82,图3为QGA-GRNN进化过程图,可以看出在45代时已寻得最优值。
3 质量预测模型应用
在获得3个模型后将其应用于实际生产的乳胶丝质量预测中,借此比较3个模型的预测效果。与建模数据一致,同样选取1个批次的42#乳胶丝,在该批次生产中每间隔2 h采样一次,总共采样10组数据。
为衡量3个模型的预测效果,引进MSE作为评价指标,即模型预测值与实测值差值的平方和再除以数据组数,表2所示为3个模型预测效果。
图4所示为3个模型预测效果比较,以300%定伸应力为例解释图形的绘制,以该项目MSE最大值为单位高度,即多重多元回归MSE为单位高度,剩余两个模型高度为相对高度,即其MSE值与最大MSE的比值,同理可得到拉伸强度及拉断伸长率比较图。
从图中可看出QGA-GRNN模型在拉伸强度方面预测能力与GRNN模型相仿,在300%定伸应力和拉断伸长率方面预测能力均优于多重多元回归和GRNN模型,这证明QGA对GRNN的参数寻优是有效的,QGA-GRNN模型更适用于挤出式乳胶丝质量预测。 4 结束语
本文利用工业组态技术获取乳胶丝关键生产参数,采用多重多元回归和广义回归神经网络得到质量预测模型,同时引进量子遗传算法优化广义回归神经网络。应用结果表明,采用量子遗传算法优化的广义回归神经网络能更好地解决复杂乳胶丝生产的最终质量预测问题,可推广到其他多工序或复杂工艺工业产品质量预测建模与应用中。
参考文献
[1] 胶乳胶丝:HG/T 2889—2011[S]. 北京:化工出版社,2012.
[2] 甘木伙,赵均明,陈顺安. 乳胶丝生产工艺:ZL201110068362.0[P]. 2012-05-30.
[3] NAJAH A, EL-SHAFIE A, KARIM O A, et al. Application of artificial neural networks for water quality prediction[J]. Neural Computing and Applications,2013(221):.
[4] 杨杰,刘桂雄. 基于小波Elman神经网络的活塞环渗氮质量预测控制[J]. 华南理工大学学报(自然科学版),2009(2):45-48.
[5] SHI J, LIU X G. Product quality prediction by a neural soft-sensor based on MSA and PCA[J]. International Journal of Automation and Computing,2006,31(1):17-22.
[6] 丁徽,谢健,段文英. 基于多重多元回归的木材干燥质量预测模型[J]. 东北林业大学学报,2012(6):131-133.
[7] SPECHT D F. The general regression neural network-Rediscovered[J]. Neural Networks,1993,6(7):1033-1034.
[8] WANG T, WANG Y, GUO C, et al. Application of QGA-RBF for Predicting the Amount of Mine Gas Emission[J]. Chinese Journal of Sensors & Actuators,2012(1):123-127.
(编辑:徐柳)