论文部分内容阅读
数据挖掘(Data Mining)能从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式,它是数据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。数理统计作为数据挖掘的3个主要支柱之一,有许多寻找变量之间规律性的方法,而回归分析方法是其中最有效的方法之一。本文拟对作为数据挖掘机制之一的回归分析方法进行讨论,并给出将其用来实现锻模设计准则的制定的一个实例。本文的主要工作总结如下。(1)对数理统计在数据挖掘中应用的国内外研究现状进行了综述,阐述了数理统计与数据库技术结合的特点,概述了基于数理统计的数据挖掘技术。(2)阐述了数理统计与数据挖掘的关系。对数据挖掘的研究历史和现状进行了叙述,给出了数据挖掘的定义,对数据挖掘与相关技术的关系进行了讨论,探讨了数据挖掘所发现的知识类型、数据挖掘的功能、数据挖掘常用技术、数据挖掘中的数据仓库等内容。阐述了数据挖掘系统的工作原理。(3)阐述了回归分析的基本概念;给出了线性回归方程的定义,详细论述了其参数估计方法和线性相关的显著性检验方法;讨论了非线性回归方程、多元线性回归方程的模型和参数估计方法。讨论了在制定工艺算法时应用数理统计的方法。(4)研究了计算飞边的算法和数学描述。给出了采用逐步回归分析法建立锻模设计准则的实例。就逐步回归分析的软件设计、锻模飞边尺寸设计准则的制定、锻模飞边金属消耗设计准则的制定等问题进行了研究。最后,得出了利用逐步回归分析软件建立的上述两类准则,并对结果进行了分析,实验验证了该算法的有效性。