浅谈油田信息数据仓库及数据挖掘

时间:2022-09-12 03:38:48

浅谈油田信息数据仓库及数据挖掘

摘 要:随着数据库的发展,当今全球数据库的容量规模已经有了上万亿字节之多,如此大的数据量在现今已经给人带来了一种数据爆炸的感觉。虽然如此庞大的数据库容量以及数据体系往往给使用者造成一种无从下手、毫无头绪的感觉,但是通过仔细地分析和观察可以发现在这些海量的数据背后,有着很多非常具有价值以及决策意义的信息。在油田企业的建设和发展中,如何将数据库中的数据进行有效的数据挖掘,从而使得这些有效的数据能为油田企业的决策和战略发展的资源和动力,这将是文章将要重点探讨的问题。

关键词:油田企业 数据仓库 数据挖掘

随着社会发展以及市场竞争愈发激烈,对各个行业内的企业都提出了信息化建设的要求。我国企业信息化的发展建设正呈现出一片“数据集中化、业务综合化、决策科学化、管理扁平化”的趋势。各个企业为了实现国际竞争力和市场竞争力的提升,都开始实施建立以企业长期积累的历史数据以及核心业务为主的数据挖掘系统。通过这一举措,可以使得公司的生产和经营能够随时与市场保持同步,从而使企业能够紧跟市场的步伐,保持经济效益的增长。但是就世界范围来看,我国的石油企业在对数据仓库进行数据挖掘方面依旧与国外的大型石油企业依旧存在着一定的差距。文章将就我国石油企业该如何对石油数据仓库进行有效的数据挖掘提出相关的方法和一些建议措施。

一、数据仓库的定义以及体系结构

1.数据仓库的定义

目前国际上对于数据库的定义为:可以支持管理决策过程的、面向主题的、集成的、稳定的、不同时间的数据集合。主题是进行数据归类的重要标准,每一个不同的不同的主题都可以对应一个客观的分析领域,并且可以对多个部门对个系统的大量数据进行集成,从而辅助管理者进行决策。这些通过集成而来的数据会被数据库所收集,并且常年保持着不被更新的状态。数据库一般会在5~10年左右,进行一次对于时间趋势的分析。

2.数据仓库的体系结构

数据仓库是既是一种结构和富有哲理性的方法,也是一种技术,数据和信息从不同的数据源中被提取出来,然后将这些数据转换成为公共的数据模型并且和仓库中已有的数据集成在一起[1]。用户在向数据仓库进行数据的查询时,数据仓库便会将用户所需要的信息进行整合并且提供出来,通过这一方式,数据冲突以及表达不同的问题便会得到有效的解决,方便管理决策者在进行数据查询时整个查询过程变得更加有效并且易于操作。数据仓库作为一个系统,其功能主要有以下几个方面。

2.1数据的获取

数据仓库在进行数据获取时,数据获取的部分可以从过外部数据源中收集并获取数据。在获取数据后,数据仓库还会将数据进行区分,通过拷贝或是对格式进行重新定以后,载入数据仓库。

2.2对数据进行存储和管理

数据库的这一功能是主要职责是维护并管理数据库的内部。其服务的方式主要是对数据存储进行组织、对数据进行维护和开发等。

2.3信息访问的功能

作为数据库的前端,信息访问功能需要面向不同的终端用户。数据仓库的终端用户可以通过信息访问的功能在数据仓库中进行信息的提取、对数据进行分析终而实施可以使企业获得竞争优势的决策。在对数据信息进行访问时,通常需要一些工具软件的支持,例如查询生成工具、多维分析工具以及数据挖掘工具等。由于新的工具软件也成了相关软件企业之间相互竞争的地方,所以在数据仓库的信息访问中,信息访问工具软件将会使得数据仓库与管理决策者之间的联系越来越紧密。

二、油田信息数据仓库的建立

由于油田数据与其他行业的数据相比而言较为特殊,这些数据主要着重于反映油井的一些指标数据,例如产油量、油的含水量、油田注水以及聚合物的含量等。但是因为在线存储测井数据体就有1800多个,2400口探井的数据记录甚至有23万多条之多,同时还有一些辅助单位的油井维修数据、还有研究单位的数据等,可以说油田数据是单一性的复杂化[2]。因此,通过建立一个数据仓库,从而能对油田数据进行规范的分类管理显得十分必要。

在建立油田信息数据仓库的时候,可以将数据仓库中的数据进行分级处理,这几个级别分别是:早期细节级、当前细节级、轻度综合级、高度综合级。

在源数据经过处理和汇总之后,便可以进入当前细节级,在对经过处理和汇总后的源数据进行综合分析,便可以进入轻度综合级甚至是高度综合级,在早期细节级中的数据一般都是一些历史性的数据。

元数据(Metadata)作为在数据仓库中另外一种重要的数据。油田数据在数据仓库的环境之下可以转化为两种源数据:为了将操作性环境转化为数据仓库而建立的元数据,这种元数据包含了几乎所有的源数据的项名以及属性,还有其在数据库中的转化;另一种元数据主要是用于建立与终端用户的多维商业模型以及前端工具之间的联系。

存储和管理是数据仓库的主要用处。油田数据仓库的建立及其组织管理的方式,使得其与传统的数据仓库存在着一定的区别,这些区别也是油田数据仓库对外部数据的主要表现形式。

三、油田数据仓库的数据挖掘

针对油田数据数据量大、复杂,并且历史数据繁多的特点,在完成油田数据仓库的准备阶段之后,便可以通过数据搜索,建立模型、模型检验、民星应用、模型分析等步骤进行数据的挖掘。建立模型是这些步骤中最为关键的一个环节,建立相应的数学模型可以为数据挖掘提供高效的计算方法和解决方案,在进行数据的挖掘计算时,通常可以通过采用关键规则、决策树、粗糙集、统计分析、神经网络、支持向量机、模糊聚类、基于范例的推理、贝叶斯预测等计算方法进行数据的挖掘计算[3]。同时在建立数据模型时,需要将数据分为校验数据和训练数据,再对模型进行检验,从而对模型的准确程度进行评估。基于以上阐述课可以了解到,油田数据的挖掘过程其实就是一个数据搜索、模型建立以及检验的过程。

四、结语

文章通过对油田信息数据仓库,以及油田数据挖掘的阐述,提出一点的分析以及意见方法,凸显了数据挖掘在油田企业的现代化信息管理中的作用。因此我国的油田企业必须建立相应的企业历史数据以及核心业务的数据挖掘系统,从而增强企业的在市场上的竞争力。

参考文献

[1]王珊.数据残酷技术以及数据挖掘的研究综述[J].软件学报.2008(9).

[2]于晨.数据挖掘中趋势模型的建立与分析[J].计算机工程应用.2012(8).

[3]刘晓明.大庆采油九厂生产辅助分析系统[J].哈尔冰工业大学学报.2009(6).

上一篇:钻井自动化核心技术的运用探析 下一篇:2机组厂用ECMS系统设备的应用及改造