论文部分内容阅读
数据挖掘技术是随着数据存储技术的迅速发展、数据库规模的日益扩大以及人们对数据库中潜在信息的需求而迅速发展起来的新兴的数据处理和分析技术,是计算机技术、数据库技术、人工智能、统计学等相结合的产物。文章介绍了数据挖掘技术的产生渊源、基本思想和主要研究成果,同时还介绍了数据挖掘在工业过程优化领域的应用现状及前景,考虑到数据预处理对实现正确数据挖掘的重要性,重点介绍了几类重要的数据预处理技术。 鉴于异常样本检测对获得正确的数据挖掘结果的极端重要性以及现有的异常样本检测方法难以有效检测数据集中属性间匹配关系异常的样本的缺陷,文章提出了基于小波分析的二维异常样本检测和修复方法。该方法充分利用了小波分析的多尺度、多分辨率特性及局部分析能力,能根据某个样本对应的小波变换系数判断该样本中自变量和应变量的匹配关系是否异常,并对检测到的异常数据样本进行适当修复。在此基础上,提出了综合应用属性简约和小波分析技术检测多维异常样本的思想,即利用属性简约技术将多维数据样本的自变量降为二维或一维,然后应用低维小波分析实现异常样本的检测。根据这一思想,提出了基于非线性映照和二维小波分析的多维异常样本的检测方法。仿真结果表明,上述方法能够有效地检测到多维数据集中的属性关系异常样本。 在综合分析铜转炉吹炼过程机理、吹炼工艺制度和数据挖掘技术在铜转炉吹炼过程优化中的应用途径及技术优势的基础上,针对铜转炉吹炼过程变量多、非线性强、各变量间存在强烈耦合、生产现成积累的操作数据量大、难以建立精确数学模型等特点,以实现吹炼过程的节能降耗、提高资源利用率为目标,提出了利用数据挖掘技术实现铜转炉吹炼过程优化决策的思想,研究了基于数据挖掘的铜锍转炉吹炼过程优化的一般方法,并以渣产出量的预报为例说明了该方法各实现环节的特点和难点,建立了综合利用回归分析和神经网络技术的渣产出量的组合预报模型。利用生产现场积累的数据进行仿真试验的结果表明,文章所建立的模型预报效果良好,建模技术和方法切实可行,有较强的实际应用价值,文中所提出的技术方法和利用数据挖掘技术实现生产过程优化的思想具有明显的推广应用价值。