论文部分内容阅读
支持向量机方法和数据挖掘领域是现在国内外学术界的研究热点。数据挖掘在许多商业应用中都取得了十分理想的效果,但是在流程工业生产过程中,应用数据挖掘成功的例子还不多见。本论文在经典的数据挖掘算法中结合了支持向量机方法,并针对每个算法给出了用于实际工业控制项目的例子,讨论了基于支持向量机的数据挖掘方法在工业应用中的利弊。论文的主要内容包括以下三个方面: 首先,论文描述了基于核主元分析结合支持向量机的工业建模预测。复合肥生产工艺过程比较复杂,采用传统方法对复合肥养分含量建模难以达到理想效果。在直接使用支持向量回归建模时,数据预处理、核函数参数选择是两个难点。论文提出一种KPCA-SVR方法,结合了两种核方法的优点,又提出了一种核参数选择的改进算法,并融合到KPCA-SVR方法中,通过对实际工业数据的仿真研究,结果表明该方法取得了很好的效果。 其次,论文重点描述了基于支持向量机的关联规则提取。文中提出了一种基于支持向量机的关联规则提取方法,通过支持向量聚类、数据域描述等方法来归类样本数据,利用得到的支持向量来提取规则。该方法充分发挥了支持向量机处理小样本非线性能力强、泛化性能好的优势,并克服了其分类函数可理解性差的缺点,同时把经典SMO算法的思想引入来提高关联规则提取的执行效率。在标准数据集和实际数据的仿真中取得了较好的效果,为关联规则提取提供了一个新的思路。 最后,在文中详细介绍了一个具体的工业数据挖掘的应用实例——株洲冶炼集团硫酸厂的数据挖掘软件。该软件将关联规则、分类、聚类、回归等数据挖掘算法应用到铅烧结烟气WSA制酸过程中。另外,该软件还包括三维图像显示、在线指导等其他功能。通过使用数据挖掘软件,可以得到更多的铅烧结烟气WSA制酸过程中的信息,使变量的关系更加清晰,也方便了工作人员的操作。