论文部分内容阅读
材料数据挖掘是利用计算机和现代统计科学理论和人工智能对复杂材料数据进行整理、分析、评估、筛选、建模、预测、优化和应用等研究工作,达到材料数据驱动的内秉规律发现、未知体系预测的目的。自从2011年美国政府提出“材料基因组计划”以来,材料数据挖掘研究工作发展很快,很多研究者利用数据挖掘方法,探寻材料性能与其组份、结构及工艺参数之间的定量关系模型,用以预测、设计和优化新材料的性能,从而加快新材料的创新过程。本论文工作主要内容概括如下:(1)材料数据挖掘方法与应用的研究背景和最新进展综述在大量文献调研和本课题组多年材料数据挖掘研究的基础上阐述了材料数据挖掘与材料设计、材料信息学、材料基因组工程、材料工业优化的密切关系,概括了材料数据挖掘的常用方法及其优缺点,并分析其研究的基本流程,总结其最新研究进展,探讨其未来发展趋势。(2)ABO3型钙钛矿材料比表面积(SSA)的数据挖掘钙钛矿材料比表面积(SSA)不仅与其元素组份有关,而且与其实验工艺参数密切相关。发现ABO3型钙钛矿材料比表面积(SSA)的实验测试结果的相对误差较大,计算机建模预报其SSA的挑战性很大。本工作以文献中收集到的ABO3型钙钛矿材料样本的SSA数据作为目标变量,以其21个原子参数和3个工艺参数为候选的自变量,研究ABO3型钙钛矿材料SSA的定量预报模型。利用遗传算法结合相关向量机的变量筛选方法,选出了建模所需的9个特征变量,即Ra(A位元素的原子半径)、Rb(B位元素的原子半径)、IF(容忍因子)、a O3(单位晶格边值)、B-Tb(B位元素的沸点)、DA(A位密度)、DB(B位密度)、CT(煅烧温度)和AH(煅烧时间)。研究表明:基于相关向量机(RVM)模型的ABO3型钙钛矿材料SSA的预报值与实验值的相关系数(R)对于训练集和外部测试集的相关系数分别为0.84和0.68。(3)基于数据挖掘的氟橡胶生产工艺优化本工作收集了氟橡胶(FKM)生产装置有关工艺数据,利用统计分析和Fisher判别矢量法等数据挖掘方法分析了FKM产品的门尼粘度与其生产工艺参数间的关系,得到了FKM产品的生产工艺优化方案,并在生产装置上进行实施,使得产品的门尼粘度在36-45区间的生产合格比例由53%提高到85%,大幅增加了FKM产品的门尼粘度合格率,提高了企业的经济效益。(4)数据挖掘在二氢查尔酮降血糖功效筛选中的应用本工作通过数据挖掘,采用支持向量机回归(SVR)算法研究具备不同位置和数量取代基的二氢查尔酮类化合物的定量构效关系,建立了该类化合物降血糖性能与其分子参数之间的相关关系,并得到验证,形成了寻找降血糖性能更强的二氢查尔酮类化合物的筛选方法。我们认为基于数据挖掘的材料性能优化(包括工业优化技术)及分子筛选方法大有可为,有望不断取得令人鼓舞的应用成果。