论文部分内容阅读
为提高测井数据的管理水平,克服传统测井数据管理中出现的保存不便、易于损坏、利用效率低的缺点,各测井公司和采油厂纷纷建立了测井数据库,由于测井公司和采油厂在数据库和数据库管理系统的选择上不尽相同,分布、异构、难以共享等特点致使它们在一定程度上制约着测井数据的利用效率和油气勘探开发的顺利进行。为此,提出了测井数据仓库的设计,它是一种能够提供最佳信息利用的解决方案。本文主要研究测井数据仓库的构建和数据清洗技术的实现,具体工作如下:(1)常用数据仓库技术和数据清洗技术研究。在分析数据仓库技术基础上,确定采用增量数据抽取方式及SQLServer2005的ETL开发工具,建立包括数据源元数据、清洗规则元数据、分析方法元数据等在内的元数据库;针对模式层和实例层可能出现的数据质量问题,采用了不同的数据清洗方法,通过使用SQL命令和SQL编程实现了模式层和实例层的数据清洗操作,实验结果表明其数据清洗方法是行之有效的。(2)测井数据仓库的设计和研发。根据测井数据特点和各种测井数据库状况,基于现有数据仓库系统提出了测井数据仓库设计方案,完成测井数据仓库的研发。依据数据流向整个测井数据仓库的总体架构可设计为常规数据库、基础数据库、主题数据库和应用系统四层。采用星型数据设计模型,建立维度表和事实表,实现基于文件和数据库的数据集成。(3)测井数据仓库的实际应用。根据研发的测井数据仓库开展web智能分析和数据挖掘应用,在Web上支持用户对测井数据进行查询及下载,对油气产量进行占比分析、比较分析、趋势分析等智能分析操作;与自主研发的智能数据挖掘系统进行了挂接可以进行油层识别等测井解释工作,实际应用表明该测井数据仓库设计科学、合理,满足应用需求。