论文部分内容阅读
测井解释是深部钻探研究的一种首要的信息来源。事实上,由于结晶岩复杂的地质特征以及理解和使用这些复杂、密集数据的困难性,使得解释结晶岩地球物理测井存在一定的难度。此外,迄今为止没有系统制定解释、分类结晶岩的地球物理方法,从而对利用地球物理测井资料准确识别岩性构成挑战。自动化测井解释提供了两个直接的好处:首先,它使我们能够迅速处理大量的文件,从而支持建立大型的知识库;其次,自动化产生一致的结果。由于早期计算机引入到地球科学,算法结合地球物理学家的推导对地球物理领域做出了显著的贡献。模式识别方法是其中重要的一部分。通过模式识别方法成功预测能力来解决地球物理学不同的问题,本文探讨使用模式识别方法来处理数据对结晶变质岩进行分类。这些模式识别方法对中国大陆科学钻探主孔(CCSD-MH)的数据进行处理,它提供核心数据和13测井曲线(CNL[补偿中子],DEN[补偿体积密度],PE[光电吸收俘获截面],VP[P波速度],GR-γ射线],K[钾含量],KTH[钾钍],TH[钍],U[铀含量],RD[侧向深电阻率],RSFL[球形聚焦电阻率],RS[浅电阻率],GRSL[1329系列频谱伽玛射线])。依相关准则,测井曲线解释总是大大减少要进行的维数。这种减少可以基于(1)通过具体的判断(例如,目视检查)删除曲线;(2)统计技术。前一种方法往往因测量的数目减少而更加减少。因此,这种方法已被证明是耗时且容易出错。在此基础上,出现了使用计算机辅助统计技术提取、从原来的测井曲线集选择有意义的数据集的方法。后一种方法,在一般情况下,可以显示数据集中重要的、用于识别的岩石类型的数据集。本文主要研究后一种方法的应用。维数降低,如主成分分析(PCA),因子分析(FA)和线性判别分析(LDA)用于减少CCSD-MH的原始数据集的维数,在保持尽可能多的原始信息的情况下以合适的数据量套入分类器。变质岩分类方法主要包含五种,即支持向量机(SVM),K-最近邻(K-NN), BP神经网络(BPNN),径向基函数神经网络(RBFN)和自组织映射(SOM)。前人做了大量的结合降维和分类策略的研究。其中有待解决的问题是找到最合适可用于表征变质岩的数据集和分类器。另一个令人关注的问题是采用交叉验证技术来采取更好地利用现有的训练数据。此外,本文通过增加学习能力,如学生配对t检验指导分类决策。实验研究结果证明,降维(DR)减小的数据集可以更好地分离变质岩类型或几乎和原始数据集的。研究发现LDA比PCA和FA具有更好的性能,因为它直接处理分类器。地球物理测井资料对5组岩石(片麻岩,副片麻岩,角闪岩,榴辉岩和超基性岩)的分类结果表明,结晶变质岩地层岩性分类器在所有上述岩性的分类中效果较好。BP神经网络是所有监督分类器中最好的。因为它在低岩样和高维空间的数据集中具有更好的性能。通过比较无人监管的SOM和BP神经网络,SOM和BP神经网络的性能具有可比性。在这个意义上,SOM和BP网络之间效果差别的大小在统计上并不显著。这项研究的意义不是否认依赖专业知识和地球物理学家解释经验,而是要展示如何将任务可以更简化、更有效。这样地球物理学家能够专注于更重要的信息。这项研究帮助更好地了解模式识别系统及其在CCSD-MH数据分析的相关性。最后,该研究能给地质学家提供一个新的视角和方法