胜利油田数据网格开发建设构想

时间:2022-08-12 10:10:45

胜利油田数据网格开发建设构想

关键词:胜利油田;数据网络;开发建设

中图分类号:TP13文献标识码:A文章编号:1812-2485(2012)03-034-1

在石油勘探和开发中油藏模拟有很高的实用价值,可以用来预测不同的生产变量产生的情况。油藏模拟中既需要静态的地质、勘探数据,又需要动态的生产开发数据。在这些数据的基础上,形成对油藏状况的连续模拟,找出油藏的演化规律,为以后的生产开发提供充分的科学依据。油藏模拟需要快速、简便地访问各种计算资源、共享信息和数据,勘探和开发数据的分离,阻碍了油藏模拟在生产的应用。一个典型的黑油模型数值模拟的网络模拟的网络规格一般在2~5万数量级。对于胜利油田这种规模的模拟,也只能保证井间一般有1~2个空网格。对于很多问题,这是远远不够的。高性能的计算是阻碍勘探开发信息一体化在生产中发挥效益的一大障碍。

实现大规模高性能计算通常采用两种方式:一种是采用高性能计算机,另一种是计算机集群。高性能计算机如SMP(对称多处理器)计算机、MPP(大规模并行处理)计算机等,这些计算机有很高的配置(如大内存、海量存储、可多达上千个的处理器等),具有很高的处理能力。但与这些计算机的高性能相对应的是它们高昂的价格。相比之下,计算机集群是现在应用较广泛的技术。

集群是一种分布存储的并行系统,各结点通信主要使用消息传递方式。集群与MPP(大规模并行处理)计算机的主要区别有:集群的每个结点都是一个完整的计算机系统,包括CPU、内存、硬盘,可能没有显示器、键盘、鼠标等设备;MPP的每个结点内不一定有硬盘。集群的结点间通常使用低成本的商品化网络相连,如以太网、ATM等,而MPP使用专门定制的网络,这个是集群与MPP主要的区别。集群结点与系统级网络的网络接口是连接到结点内的I/O总线上的,属于松耦合;而MPP的网络接口是连到结点内的存储总线上的,属于紧耦合。集群的每个结点上驻留有完整的操作系统;而MPP的结点内通常只有操作系统的微核。胜利油田信息中心使用Turbolinux Server、TurboLinux DataServer+Oracle、TurboHA、enFuzion软件,基于Intel 架构上的高端服务器,把现有的计算机网络变成一台高性能计算机集群。

集群技术可以满足我们现在的部分需求,但它还存在一些缺点:

首先,现在集群技术没有实现底层对用户应用层的完全透明,用户维护集群系统比较困难。比如采用数据可分的enfuzion集群系统,当升级集群系统时,需要为集群系统重新人工分配数据量。

其次,目前的集群系统,数据库支持能力差,尤其是对于分布式数据库的负载平衡、容错性支持不够,数据库的运行效率并没有随系统集群后速度的增加而增加。这对于拥有超大数据量的油田勘探开发数据来说,实现勘探开发信息一体化,显然不能满足要求。

现在,迅速发展的“网格计算”正在克服集群技术的局限性,逐渐成熟起来,成为企业实现价格低廉的高性能计算和高效分布式数据库管理的一个新的选择。

网格是通过局域网或广域网提供的一系列分布式计算资源。网格计在逻辑上将接入网络的多台计算机作为一台计算机使用,通过提高各台计算机的使用效率,使其整体的处理能力大大提高,甚至与超级计算机媲美。对终端用户或应用来讲,好像是一台大型虚拟计算机。在用户、资源之间实现安全、协调的资源共享,创建了一个虚拟动态的组织。在网格计算模式下,系统可以自动向每台计算机分配处理任务。如果其中一台计算机出现故障,其它的计算机可以自动替代它并继续进行处理。

网格通常可以分为三类,即存储网格、计算网格和服务网格。

存储网格实现了虚拟的统一存储,例如可将不同系统不同目录下的文件通过网格软件组合成一个虚拟的单一文件目录,对此网格的用户来说,他不必关心他所需要的文件具体存放在那一物理位置,而可以通过一个单一的文件目录结构存取或检索所需要的文件。他还可以使用与传统工具相类似的网格工具,如同FTP将自己的文件传送到这一虚拟的单一文件目录结构中去,或将虚拟存储中的某一文件传送到自己的本地非共享目录中。存储网格增强了人们分享数据信息的手段。

计算网格是网格技术提出的初衷。计算网格可以看作是本地同构计算集群的一种广域异构扩展,实现将计算任务提交给一台虚拟的巨型计算机,即计算网格。

服务网格不只是支持科学计算,还支持其它服务,包括通信服务、数据服务、信息服务、计算服务、交易服务等等。它实现了网络资源一体化,网格中的所有资源都联成了一个整体,实现了全面的资源共享和协同工作。

网格计算的实现,使广域范围内不同标准的异构“孤岛”得以连接,实质上就是打破了传统的“IT资源”应用和管理的限制,使得复杂的IT系统动态地组成一个虚拟整体,经济、高效地提供计算支持。

比较一下集群系统和网格体系,可以看出集群系统应用单一,涵盖的内容要比网格少得多。从一定意义上说,网格是在集群的基础上发展的高级形式。

网格资源:包括网络上所有分布的,可访问的计算资源。仅仅实现了计算资源在物理上的连通。网格中间件:一系列工具和协议软件。屏蔽网格资源的分布、异构特性,提供透明、一致的接口。网格开发环境和工具:让开发人员开发不同的应用以及用户在全局资源中调度计算。网格应用:是用户需求的具体体现。提供网格入口(grid portals)技术。

网格计算目前已进入实用阶段。SUN推出了Sun ONE Grid Engine用于构建网格系统;Oracle推出了oracle 10g(g代表grid)数据库,全面支持网格计算; OGSA组织的Globus Toolkit被许多企业、机构用于网格开发,成为网格计算的一个事实标准。

现在,我国部分石油生产企业已经应用集群技术服务于采油工程的油藏数值模拟。而在胜利油田的许多单位里,虽然也急需这样类似的应用,为油田的决策提供更科学的理论依据,但应用水平相对较低,不能作为油藏经营管理决策的一个重要依据。随着网格技术的高速发展,尤其是Oracle、IBM、SUN等大公司的推动下,网格必将快速普及。因此,着手勾画、构建 “胜利油田数据网格”,使企业在信息化、集成化、智能化方面有更快的发展,为实现勘探开发信息一体化,为实现数字化胜利油田奠定基础。

上一篇:拓展海南国际旅游岛融资渠道研究 下一篇:关于延长法定退休年龄的探讨