论文部分内容阅读
油气是我们国家紧缺型的战略性资源。我国深部碳酸盐岩地层拥有着丰富的油气资源,但储层识别困难。地震波形数据中隐含了大量的储层信息,而聚类分析是进行储层识别的有效方法。原始地震资料所表达的储层信息有限,因此,为进一步挖掘地震数据中的隐藏信息,本文针对深部勘探目标,通过构建深度学习特征学习网络模型,利用其强大的非线性特征提取以及组合低层特征得到更加抽象的高层表示类别或特征的能力,对地震数据的含气性响应特征进行提取,以发现地震波形数据中的分布式特征表示,并进行聚类分析,从而进行深部储层检测,以提高储层含油气性检测的可靠性和有效性。该方法对地震数据还具有较好的降噪功能。论文的主要研究内容与成果如下:(1)在对各种深度学习网络基础原理进行研究的基础上,重点研究了深度降噪自编码算法(SDAE)。SDAE是由无监督浅层学习模型之一的降噪自编码(DAE)进行叠加得来的,DAE是一类接受损坏数据作为输入,并训练来预测原始未被破坏数据作为输出的自编码(AE)。SDAE不仅具有降噪功能,还能从不同隐藏层学习到数据中不同层级和高层的潜在的特征。基于此,本文结合深度学习框架TensorFlow和matlab完成了整个深度学习特征提取模型的程序设计。(2)通过超参数、隐藏层数和隐藏层节点数的调节,完成了SDAE模型的训练。为避免深度网络可能会出现的梯度消失等问题,使用深度学习逐层训练的方法进行训练,并以重构误差、不同隐藏层特征类别区分性以及相关性分析为标准,调节超参数、隐藏层数和隐藏层节点数。通过大量实验,确定学习率为0.001,衰减率为0.1,批处理大小为32,使用的优化器为Adam optimizer,激活函数为sigmoid;还确定了编码阶段和解码阶段的隐藏层数和隐藏层节点数,以保证网络结构的合理性和有效性。(3)选取适用于SDAE模型训练的地震波形时窗数据体。分析了不同时窗数据体训练SDAE模型,对比不同的模型,表明20ms时窗较窄,容易受到解释噪声和地震资料噪声的影响,结果具有相对较弱的稳定性,变化幅度也较大,而较宽时窗则相对稳定。因此,选取时窗较大的40ms和60ms能够得到比较可靠的结果。(4)研究了相关性分析以及特征可视化进行特征优选的方法。通过相关性分析优选出与输入数据中具有高度相关性的特征,并进行可视化,找到更具有代表指定性类别的特征,从而进行聚类分析。同一类别的特征具有相似的特征激活,目标特征与目标样本具有关联性,相关性越高,含油气性类别划分越明显。(5)对比了原始数据进行聚类分析与使用SDAE提取的特征进行聚类分析的结果。实验结果表明,SDAE所提取的高层特征聚类效果比浅层特征聚类和原始数据直接聚类得到的效果更好,含油气性类别划分也更清晰。但是这并不表示浅层的特征都不能划分出含油气性,需要进行综合分析。(6)使用多GPU并行计算和深度学习推理优化器TensorRT分别对模型的训练阶段和推理阶段进行加速。训练阶段速度由显卡性能和显卡数量决定,显卡数量越多,训练速度越快;推理阶段,使用TensorRT将模型转换成FLOAT16格式,相同环境下,能够将推理速度提高3倍以上。