论文部分内容阅读
早期储层地质建模方法有两种:基于两点的地质统计学方法和基于目标的方法。两点地质统计学方法以空间两点相关性作为统计基础,以基于变差函数的方法为代表方法,该类型方法以象元为基本建模单元,易于满足井数据。然而,该方法只能统计空间两点相关性,难以再现复杂地质结构的连通性等特征。基于目标的方法以复杂几何形态的储层结构单元为基本建模单元,如弯曲的河道,这类方法直接根据河流地质特征确定几何形态参数,一次模拟一个完整的地质体对象(如河道)。该方法难以满足条件数据,对于离散的少量条件数据,还能通过后处理修正使模型符合条件数据的约束,但对于密井网条件数据则无能为力。综合两点地质统计学与基于目标建模方法的优点,多点地质统计学方法既能满足井数据,又能模拟复杂几何形态。近30年的发展,多点地质统计学取得丰硕成果。ENESIM算法首创地融合两点统计学和基于目标方法的长处,以训练图像为原型模型,既能再现地质单元复杂结构,又能满足井数据,为多点方法的发展提供了重要思路。Snesim用数据样板扫描训练图像,提取所有数据事件及其概率,存储于搜索树,建模效率取得极大提升,然而搜索树占用内存很多。为了解决多点地质统计学(Multiple-point geostatistic,MPS)的效率低、内存占用大的问题,国内外学者专家提出以下几种改进思路。第一种改进思路是基于数据样式的建模方法,单步模拟多个网格单元构成的数据样式,此方法有两个优势,首先是将空间多点相关性数据存于数据样式能减小内存开销,其次是单步模拟一个数据样板大小的区域比单步模拟一个网格节点具有更高的计算效率。Simpat算法是首个基于数据样式相似度建模的算法,该方法从样式数据库里查询与数据事件相似度最高的数据样式,通过替换、冻结数据事件的所有节点完成对未知部分的预测。改进算法Filtersim基于过滤器对数据样式实现聚类,进一步提高建模效率。DisPat算法采用MDS降维和K均值聚类对样式数据库进行聚类,提高了建模效率;第二种改进思路是,以单个网格节点为建模基本单元,用更先进的数据结构存储训练图像中数据事件及其概率信息。以IMPALA算法为例,综合应用列表结构与索引树组合结构,优势在于既能借助于列表的并行计算提高建模效率,同时避免占用过多的计算机内存。第三种改进思路以数据样板为约束,单步模拟一个网格节点。以Direct Sampling算法为例,该方法进行数据样式匹配时,扫描取得与数据事件相似度最高的数据样式即可,将数据样式的中心节点值作为目标估计值赋给网格节点,DS方法计算效率高,不足之处在于算法的参数难以调节。第四种思路是借助于其他领域(如图像处理和分析等)的技术,以基于图像拼接的IQ建模方法为例,该算法采用GPU并行计算,效率高,缺点是图像拼接算法缺乏统计学理论支撑,并难以融合条件数据。随着计算机软硬件的发展,除了算法本身的优化之外,国内外学者将CPU、GPU并行化作为优化改进多点地质统计建模算法的研究方向。本文从效率、内存、非平稳三个主要问题入手,提出PSCSIM、LSHSIM和ASNSIM三种算法。PSCSIM算法采用邻近等间距重采样降维法,对数据样式做聚类,实现了建模效率的提升;LSHSIM引入局部敏感哈希检索技术,完成对数据样式的哈希散列化,极大提高建模效率;ASNSIM综合多维尺度分析和K均值聚类,实现了对非平稳训练图像的客观化分区,进而完成基于非平稳训练图像的建模。通过对多点地质统计建模算法Simpat的基本原理进行分析,本文认为Simpat算法的效率瓶颈在于数据事件与海量数据样式之间的相似性计算过程。基于此认识,本文提出对数据样式进行降维的思路,采用邻近等间距重采样法对数据样式进行降维,不仅保留空间多点统计信息,同时有效缩减数据维度,将数量庞大的样式数据库进行聚类建立样式类库。通过实例对比PSCSIM与主流多点地质统计建模算法Simpat、Snesim和Filtersim的计算耗时和内存占用,测试结果验证了PSCSIM能够在保证建模质量基础上极大提高计算效率,有效地平衡计算效率与内存占用。基于对局部各向异性与空间非平稳性内在联系的认识,提出基于局部各向异性定量表征空间非平稳性的ASNSIM算法。结合多维尺度分析和K-means聚类分析方法,对训练图像的所有局部区块对应的玫瑰花图进行降维聚类分析,对非平稳训练图像进行自动分区,分区结果客观真实,子区域内部具备平稳性特征,子区域之间相互独立。最后使用ASNSIM算法进行裂缝网络的非平稳建模实验,新方法较好地再现训练图像的空间非平稳性,说明了ASNSIM方法对多点地质统计非平稳建模算法具有很好借鉴意义。基于p-stable局部敏感哈希技术提出一种多点地质统计建模算法LSHSIM。新算法LSHSIM采用了局部敏感哈希计算数据样式的特征向量,映射至一张哈希表里。在查找数据事件最相似的数据样式时,首先从哈希表里取出与数据事件的特征向量具有相同哈希值的数据样式(可能有多个数据样式),然后从目标哈希值数据样式查找出最相似的数据样式,以此数据样式覆盖待估区的数据事件完成单步模拟。通过对比Simpat、Filtersim及DisPat与LSHSIM,不仅节省了计算机内存开销,而且计算效率最高。通过参数敏感性分析,为得到最优化建模参数提供依据。