论文部分内容阅读
以有色冶金过程为代表的复杂工业过程普遍具有多变量、非线性、大滞后、强耦合等特点,难以利用机理分析建立系统数学模型并实现优化操作与控制。我国的复杂工业过程的操作决策在较大程度上依靠人的经验,因此,相关生产过程能耗高、运行不稳定、原材料消耗大,在节能降耗、提高产品产量和质量等方面存在巨大的潜力。另一方面,随着工业基础自动化程度的逐步提高,多数生产单位积累了大量的生产过程历史数据,这些数据中可能蕴含有生产过程的运行规律、人工操作经验、优化操作模式等对操作决策和优化控制有用的信息,但因受数据分析技术水平和能力的限制,这些数据大多数未充分发挥作用。因此,研究从复杂工业过程数据中提取信息的数据挖掘方法具有重要的理论意义和巨大的应用价值。论文针对复杂工业过程数据挖掘方法及其应用的若干问题展开研究,主要研究内容及相关成果如下:1.基于对复杂工业过程主要特点和优化决策问题的基本分析,提出了复杂工业过程数据挖掘的基本框架。该框架对复杂工业过程数据挖掘的定义、基本任务、一般实现过程和算法构成进行了规范,并强调了复杂工业过程机理分析在提高数据挖掘效率、确保数据挖掘结果的正确性方面的重要地位和作用,对该领域数据挖掘的实施和应用具有较大的指导意义。2.鉴于数据挖掘用样本的质量直接影响挖掘结果的正确性,为提高挖掘用数据样本的质量,有效地处理样本集中的违规样本(即属性间匹配关系异常的样本),提出了一种基于小波分析的异常样本检测与修复方法。该方法利用小波变换的“高通滤波”和“时-频分析”特性,利用与样本对应的小波变换系数值检测和修复异常样本;构造了可直接用于低维异常样本检测与修复的低维小波变换系数的快速算法;应用“属性简约”思想,提出了基于非线性映射和小波分析的多维异常样本检测方法。理论分析和仿真效果表明,这种方法能有效地检测和修复数据挖掘对象中的异常样本,显著提高数据质量。3.基于对模型效果和建模用数据质量间关系的深入分析,提出了基于数据质量约束的受限最优建模思想。通过定性、定量分析建模用数据的噪声强度、样本规模等数据质量因素对模型准确性的影响,指出:模型的训练误差存在最优值(称其为期望训练误差),该值可以根据数据质量信息近似估算,并可作为模型优化的判据。据此提出了“估算期望误差—比较实际误差与期望误差—调整模型结构”的优化建模思想,并分析了实现这一建模思想的技术重点和难点。受限最优建模思想为优化建模提供了一种不依赖检验数据的判据,可以显著提高优化建模的时间效率。论文将这一思想应用于神经网络、支持向量机两种模型的优化,取得了很好的效果。4.针对神经网络建模效果对模型结构和训练方法敏感这一缺陷,提出了一种新的基于双网结构的神经网络优化建模方法。该方法兼具“结构修剪/增长法”和“提前终止法”两种传统的神经网络优化方法的优点,并克服了其不足:采用并行的双网结构,对两个子网络均采用“提前终止法”训练,既避免了网络“过拟合”,又较好地解决了“提前终止法”的“倾斜效应”;利用受限最优建模思想对两个子网络结构(即隐层节点)进行优化调整,既优化了网络结构,又在时间复杂度上远小于传统的基于交叉检验法的“结构修剪/增长法”。仿真结果表明,该方法的建模效果优于相关的传统方法。5.针对支持向量机元参数较多、且缺乏优化依据的问题,提出了一种新的高效准确的支持向量机优化建模方法。基于对支持向量机三类参数之间耦合程度的分析,将其优化问题分解为超结构参数(核参数)优化和结构参数(不敏感参数和正则化参数)优化两个相对独立的子问题;提出了一种新的基于距离关系的核校准系数以优化核参数;运用受限最优建模思想优化支持向量机不敏感参数和正则化参数。同时,还提出了利用支持向量回归误差序列和应变量序列的相关性判断模型是否“过拟合”的方法。理论分析与仿真效果表明,该方法的优化效果与交叉检验法近似,但时间效率远高于交叉检验法。6.在综合分析铜锍转炉吹炼过程机理、工艺操作制度和数据挖掘的应用条件等基础上,提出了基于数据挖掘的铜锍吹炼过程优化决策方法,并引入“支持度”和“置信度”等指标评价优化决策模型。基于本文在数据挖掘基础理论、基本方法方面的研究成果,利用某厂铜锍转炉吹炼过程积累的实际生产历史数据,建立了吹炼熔剂量和鼓风时间的优化决策模型。仿真实验表明,熔剂量优化决策模型和鼓风时间优化决策模型能够显著改善S1期的吹炼效果,具有明显的推广应用价值。建模过程体现了应用数据挖掘方法分析问题、解决问题、实现优化决策的思想,对实现其它复杂工业过程的优化决策具有重要的指导意义和显著的推广应用价值。论文研究工作表明,数据挖掘方法在实现积累有大量历史生产数据的复杂工业过程的优化决策和优化控制方面具有显著的应用价值和广阔的应用前景。