论文部分内容阅读
摘 要:近年,随着应用系统的数量逐渐增加,所涉及到的专业范围越来越广,数据的交互利用率也在逐年上升,这就对数据质量提出了更高层次的要求。针对这一问题,鲁明公司在完善数据管理制度,健全数据应用体系的基础上,着重加强"以用促采",在完善作业数据、搭建采油工程合作库和完善动态监测数据的过程中,不断寻找问题,解决问题,使数据的完善性和准确性有了一定的提升。
关键词:数据质量;数据管理;以用促采;提高
1系统现状
目前在实际工作中使用的主要系统有15个,其中局级推广的系统8个,厂级7个,局里考核的系统有8个。业务领域覆盖勘探开发6个业务域、13项业务基础数据;累计对外提供数据支持102,681次。所有系统所用到的数据都来自数据库,数据在库中是以表的形式存储的。鲁明公司目前的数据主要存储在三个库中,分别是源头库、月度库和工程库。源头库是基础,月度库和工程库都是对源头库的数据进行调用计算的,通过系统规定的算法,给出不同的指标,供开发人员使用。工程库的数据除来自于源头库,还有部分数据来自开发月度库,两部分数据进行有效算法的整合后,得出一系列工程指标。三者的关系可用下图表示:
2目前存在的问题
1)数据不齐全
在源头库中的657张表中,目前只采了366张,采油相关的地面设备(抽油机、采油树、变压器、井场配套设施等),井下工具(有杆泵、电泵、潜油电泵、水力泵、螺杆泵、封隔器、油杆、油管、井下工具、套管等)的静态档案的建立还不健全。有些表采了,但是日期不连续或者里面的关键字段缺失。例如水井的分层测试数据表ys_dca09只录入了30条数据,都是2010年以前的,这就导致分注井的月度数据处理所需的dba021这张表缺失,无法处理分注井数据,分注井的分段合格率无法计算。未采集的291张表采集的必要性、先后性都需要进一步落实。
2)数据不准确
数据不仅要齐全,更要准确,这样才能更好的服务于生产。目前在库里的数据中有些数据采了,但是并不准确。例如螺杆泵的泵径,库里的数据有3,38,40,78,89等,又如源头日度数据中的备注代码,一口井一个月没有开井,却打的2130间开间注的标记,又如一口井明明在作业系统中录了作业日记,上了措施,却在月度数据中不录入变更作业井。都会给开发人员分析数据,制定下一步的上产方向造成困扰。
数据齐全性和准确性的控制有两个步骤,分别是在录入的时候利用检查规则控制和在应用的时候根据指标反推。但是用检查规则控制,只能控制字段的非空,就是要求录入人员必须要填上,不然就不能提交或者报错,还有就是控制所填数据的类型,是汉字还是字母还是数字,还有就是可以限制数据的宽度。但是一口井的泵径是填39正确还是89正确,这是检查规则无法控制的。这就需要在后期数据应用過程中发现。如何才能做到呢?针对这一问题,我们提出了"以用促采"的概念。
3多举措提升数据质量
所谓"以用促采",只有运用好了,才能反过来促进数据采集质量的提升,前期采油工程决策支持系统的稳步运行,每个月的采油工程数据处理过程,都能够将未录动液面、抽油机档案、停井原因代码等资料不齐全的井找出来,及时补录。有效的提升了源头的数据采集质量。
1)改进采集理念,加强作业类数据的管控力度。针对目前作业类数据采集量少、质量差、无法满足应用等问题,由以往传统一对一采集转变为按施工工序采集,通过采取表齐全性检查、字段规范性检查等手段保证47张作业表及时、齐全入库;通过建立作业资料审核流程系统,构建作业队与子公司资料交互审核,解决以往施工后作业资料无审核的现状,外部施工单位数据采集的质量得到有效管控。
2)采油工程决策支持系统的23张中石化报表是开发人员进行动态分析的重要依据,但是由于历史问题,表中未包含75口合作井的数据,这就导致报表中的指标不完整,富林公司、滨海公司等有合作井的公司无法查询合作井数据。为提高数据完整性和准确性,完成了合作井采油工程库的建设工作,将采油工程库的数据覆盖到10家子公司,将原先涉及到的3张开发月度库的表格从自有库取变为从合作库取。使得油井利用率、躺井率等重要指标都包含合作井,极大地方便了业务人员进行生产分析,也利于领导了解所有井的全局生产情况,制定上产策略。
3)紧靠生产,完善动态监测系统的数据采集。动态监测技术对于认识油藏、开发方案编制、增储上产、降本增效都有着重要作用。油田推广的动态监测系统囊括了生产测井、开发试井、注水井测试和工程施工四大项内容,但是由于历史问题,动态监测库的数据一直不全不准,而且没有采集规范和考核标准。整改系统内部资料的同时将源头库和月度库中的不规范井号、油田代码、单元代码等,共计102井次,提高了源头库和月度库的数据质量。通过421条分层测试资料的重新录入,解决了源头库中分注井分层测试表不完整的问题,为分注井月度数据处理提供了数据基础。通过动态监测系统的完善,提高了源头库和月度库的数据质量,有效的达到了以用促采的效果。
4 未解决的问题
1.继续完善数据齐全性。目前常用的表基本都已采全,能够保证各系统的正常应用,可是随着新系统的推广,一些未采集的表会逐步暴露出来,这就需要我们对未采集的两百多张表有一个完整的计划,从目前正在推广的采油工程基层业务平台等系统出发,整理出下步要完善的表,完善响应表的采集规则,尽早将数据入库。
2.数据准确性需不断提高。完善的管理手段、齐全的检查规则、系统的交互检查,这些就能够保证入库数据的准确性了吗?恐怕不尽然。前面种种能够对一个字段的连续性、一致性、值域、非空等进行检查。到底某口井的泵径是填38还是72,这个通过前面的手段是无法确定的。也就是说目前我们缺乏有效的数据审核体系,信息中心的数据管理员所具备的专业知识毕竟有限,所以只是利用有限的工具对数据齐全性初审是不够的,这就需要更多的专业部门参与进来,共同提高数据质量。
参考文献:
[1]张华义等.数字油田建设中的数据质量控制方法研究.天然气勘探与开发,2015.
[2]孟巍. 数据仓库数据质量评价研究及其应用[D]. 河北工业大学 2004
[3]冯莉.数据质量控制体系在油田信息管理中的应用①--以新疆油田数据管理为例[J]. 科技创新导报. 2012(24)
[4]张磊. 油田数据质量监督与控制模型研究[D]. 大庆石油学院 2010
关键词:数据质量;数据管理;以用促采;提高
1系统现状
目前在实际工作中使用的主要系统有15个,其中局级推广的系统8个,厂级7个,局里考核的系统有8个。业务领域覆盖勘探开发6个业务域、13项业务基础数据;累计对外提供数据支持102,681次。所有系统所用到的数据都来自数据库,数据在库中是以表的形式存储的。鲁明公司目前的数据主要存储在三个库中,分别是源头库、月度库和工程库。源头库是基础,月度库和工程库都是对源头库的数据进行调用计算的,通过系统规定的算法,给出不同的指标,供开发人员使用。工程库的数据除来自于源头库,还有部分数据来自开发月度库,两部分数据进行有效算法的整合后,得出一系列工程指标。三者的关系可用下图表示:
2目前存在的问题
1)数据不齐全
在源头库中的657张表中,目前只采了366张,采油相关的地面设备(抽油机、采油树、变压器、井场配套设施等),井下工具(有杆泵、电泵、潜油电泵、水力泵、螺杆泵、封隔器、油杆、油管、井下工具、套管等)的静态档案的建立还不健全。有些表采了,但是日期不连续或者里面的关键字段缺失。例如水井的分层测试数据表ys_dca09只录入了30条数据,都是2010年以前的,这就导致分注井的月度数据处理所需的dba021这张表缺失,无法处理分注井数据,分注井的分段合格率无法计算。未采集的291张表采集的必要性、先后性都需要进一步落实。
2)数据不准确
数据不仅要齐全,更要准确,这样才能更好的服务于生产。目前在库里的数据中有些数据采了,但是并不准确。例如螺杆泵的泵径,库里的数据有3,38,40,78,89等,又如源头日度数据中的备注代码,一口井一个月没有开井,却打的2130间开间注的标记,又如一口井明明在作业系统中录了作业日记,上了措施,却在月度数据中不录入变更作业井。都会给开发人员分析数据,制定下一步的上产方向造成困扰。
数据齐全性和准确性的控制有两个步骤,分别是在录入的时候利用检查规则控制和在应用的时候根据指标反推。但是用检查规则控制,只能控制字段的非空,就是要求录入人员必须要填上,不然就不能提交或者报错,还有就是控制所填数据的类型,是汉字还是字母还是数字,还有就是可以限制数据的宽度。但是一口井的泵径是填39正确还是89正确,这是检查规则无法控制的。这就需要在后期数据应用過程中发现。如何才能做到呢?针对这一问题,我们提出了"以用促采"的概念。
3多举措提升数据质量
所谓"以用促采",只有运用好了,才能反过来促进数据采集质量的提升,前期采油工程决策支持系统的稳步运行,每个月的采油工程数据处理过程,都能够将未录动液面、抽油机档案、停井原因代码等资料不齐全的井找出来,及时补录。有效的提升了源头的数据采集质量。
1)改进采集理念,加强作业类数据的管控力度。针对目前作业类数据采集量少、质量差、无法满足应用等问题,由以往传统一对一采集转变为按施工工序采集,通过采取表齐全性检查、字段规范性检查等手段保证47张作业表及时、齐全入库;通过建立作业资料审核流程系统,构建作业队与子公司资料交互审核,解决以往施工后作业资料无审核的现状,外部施工单位数据采集的质量得到有效管控。
2)采油工程决策支持系统的23张中石化报表是开发人员进行动态分析的重要依据,但是由于历史问题,表中未包含75口合作井的数据,这就导致报表中的指标不完整,富林公司、滨海公司等有合作井的公司无法查询合作井数据。为提高数据完整性和准确性,完成了合作井采油工程库的建设工作,将采油工程库的数据覆盖到10家子公司,将原先涉及到的3张开发月度库的表格从自有库取变为从合作库取。使得油井利用率、躺井率等重要指标都包含合作井,极大地方便了业务人员进行生产分析,也利于领导了解所有井的全局生产情况,制定上产策略。
3)紧靠生产,完善动态监测系统的数据采集。动态监测技术对于认识油藏、开发方案编制、增储上产、降本增效都有着重要作用。油田推广的动态监测系统囊括了生产测井、开发试井、注水井测试和工程施工四大项内容,但是由于历史问题,动态监测库的数据一直不全不准,而且没有采集规范和考核标准。整改系统内部资料的同时将源头库和月度库中的不规范井号、油田代码、单元代码等,共计102井次,提高了源头库和月度库的数据质量。通过421条分层测试资料的重新录入,解决了源头库中分注井分层测试表不完整的问题,为分注井月度数据处理提供了数据基础。通过动态监测系统的完善,提高了源头库和月度库的数据质量,有效的达到了以用促采的效果。
4 未解决的问题
1.继续完善数据齐全性。目前常用的表基本都已采全,能够保证各系统的正常应用,可是随着新系统的推广,一些未采集的表会逐步暴露出来,这就需要我们对未采集的两百多张表有一个完整的计划,从目前正在推广的采油工程基层业务平台等系统出发,整理出下步要完善的表,完善响应表的采集规则,尽早将数据入库。
2.数据准确性需不断提高。完善的管理手段、齐全的检查规则、系统的交互检查,这些就能够保证入库数据的准确性了吗?恐怕不尽然。前面种种能够对一个字段的连续性、一致性、值域、非空等进行检查。到底某口井的泵径是填38还是72,这个通过前面的手段是无法确定的。也就是说目前我们缺乏有效的数据审核体系,信息中心的数据管理员所具备的专业知识毕竟有限,所以只是利用有限的工具对数据齐全性初审是不够的,这就需要更多的专业部门参与进来,共同提高数据质量。
参考文献:
[1]张华义等.数字油田建设中的数据质量控制方法研究.天然气勘探与开发,2015.
[2]孟巍. 数据仓库数据质量评价研究及其应用[D]. 河北工业大学 2004
[3]冯莉.数据质量控制体系在油田信息管理中的应用①--以新疆油田数据管理为例[J]. 科技创新导报. 2012(24)
[4]张磊. 油田数据质量监督与控制模型研究[D]. 大庆石油学院 2010