论文部分内容阅读
随着石油行业的发展以及时间的推移,油田中累积了大量的石油数据。如何充分利用这些数据并挖掘出其中的知识和规律,是一个重要的研究课题。因为对数据的研究和应用可以提高石油企业的工作效率并为其带来经济效益。但是油田数据具有数据量大、数据格式各不相同的特点,使得通过人工的方法来分析这些数据具有较大困难,此外也很难找到这些数据中所隐藏的信息与规律,而数据挖掘技术可以很好地帮助我们解决这个难题。数据挖掘在当今社会中已经成为一个耳熟能详的词汇,它在处理一些知识发现、对海量数据进行分析的方面具有其他技术无可比拟的优势。将数据挖掘技术应用在石油行业中具有重要意义。数据挖掘技术以及正在蓬勃发展的大数据技术将会为油田数据的分析作出极大的贡献。本文采用鱼骨图的分析方法,收集油气资源信息数据,并综合运用了数据挖掘技术、GIS技术、大数据技术等技术,开展了一些油气资源信息数据挖掘的研究与实践,并取得了一些成果。主要研究成果分为以下四个部分:1、通过大量的阅读文献,总结出应用在油气资源领域较多的算法,依据它们在油气资源领域的应用归纳为预测模拟、分类判别、综合评价、归纳聚类四个方面,每个方面又包含不同的算法,并根据总结结果设计并实现了基于B/S架构的油气资源信息分析算法库。与市面上流行的统计分析软件相比,此算法库专门针对石油资源数据进行数据挖掘,更有针对性。2、由于传统数据挖掘缺少可视化部分,本文应用GIS作为可视化工具进行数据挖掘。收集到来自美国IHS公司的468个盆地和12610个油田的矢量地图数据作为原始的分析数据。通过GIS对全球油气田的发现时间数据进行插值分析然后与全球盆地数据叠加分析发现:从油田发现时间上来看,近年来新发现油气田的数量呈现逐年递减的趋势,在2017年甚至达到了近60年的最低值。这一方面归因于未被发现的大型油气田数量减少,另一方面归因于2014年油气价格的暴跌使油气公司有意减少油气勘探作业。3、把对我国近些年的石油安全评价作为一个实例进行分析,采用主成分分析的算法,通过中国统计年鉴、BP世界能源统计等数据库收集到1993-2015年的影响中国石油安全度的六个指标的原始数据(包括石油在能源消费中所占的比重、历年的石油消耗强度、石油消费对外依存度、三大市场平均原油价格、储采比、石油储量替换率)通过降维后将原始指标压缩为环境因素、石油供给能力、供应风险水平三个新的综合指标。并根据指标权重计算出每年的石油安全水平综合得分,最后发现近几年的石油安全水平呈现出安全水平不断降低的趋势,从分析结果来看,国家应重点调整石油的对外依存度水平来提高石油安全度。4、针对油田“数据爆炸,知识匮乏”的现状,设计了基于大数据视角的油气资源数据挖掘架构,从大数据的视角来分析研究油气数据,将油气资源大数据挖掘平台分为3层,包括基础支撑层、数据挖掘层以及表现层,通过此大数据油气资源数据挖掘平台能够帮助用户提供节油解决方案、石油大数据可视化展现、全球石油消费分析、调度预测、油田勘探预测、油价预测等等。将数据挖掘技术与大数据技术应用在油气行业中,必然能够为将来智能油田的实现贡献力量。