论文部分内容阅读
数据挖掘技术是一种应用领域广阔,研究学者众多的知识发现方法。该方法将适当的数据挖掘方法施加于观测数据集中,提取出隐含在数据中未知的具有实际意义的信息,并以一种新颖的、可让人理解的方法表达出观测数据内在的特征或关系。由于其具解耦能力强、可行性高、结果精度可靠、应用领域广泛等特点,该技术逐渐成为生产生活,科学研究中炙手可热的研究方向之一。由于预测精度受预测模型质量的影响,本文主要研究了提高预测模型精度的方法,并将改进后的预测模型应用于煤炭生产企业物资消耗预测问题中。主要工作与成果如下所示:(1)分析了煤炭生产企业物资管理系统的特点与现阶段所面临的诸多问题;研究了预测模型与数据挖掘领域中的基本概念及原理;阐述了几种常见的数据挖掘方法,如:k-means聚类方法,支持向量机(Support vector machines)、贝叶斯方法、反向传播神经网络(Back Propagation Network,BP Network),深入探讨了这些方法在数据挖掘过程中的优缺点。(2)研究了煤矿的生产工艺,并深入探索了生产运营中每一部分所需的物资消耗,从而总结出了煤矿物资消耗成本的构成。根据煤炭企业生产的特点,精炼出了煤矿物资消耗成本的几个特点和影响因素,如:季节气候因素、储量因素、运营因素、随机因素。并简要的分析研究了这些影响因素,为预测模型的训练数据选择和预测精度的提高奠定了理论基础。(3)提出了一种集成松鼠优化算法(Squirrel search algorithm,SSA)和BP神经网络优异数值特性的煤矿物资消耗预测模型,有效的完成了本文所研究的问题。获得了令人满意的预测精度,缓解了BP神经网络自身的缺陷,如:训练过程易陷入局部最优;易过拟合或欠拟合;人为设定的迭代终止条件不能确定训练停止时的网络结构拟合的恰到好处;缺乏泛化能力等,对预测精度的不利影响,提高了获得全局最优网络结构的可能性。实验表明,对于本文所考虑的柴油、钢材、工具类的预测消耗情况,所提SSA-BP神经网络预测模型能够得到更为精准的结果。BP神经网络作为预测模型的基础结构,提高了数据之间非线性关系的表达能力,确保了预测过程的稳定性;采用SSA优化了BP神经网络的权值与阈值,提高了获得全局最优网络结构的可能性。研究发现提高了煤炭生产企业物资预测模型的精度,为煤矿生产计划的制定做出贡献。该论文有图12幅,表7个,参考文献83篇。