GIS如何通过Geodatabase实现一体化数据管理

时间:2022-09-04 09:47:04

GIS如何通过Geodatabase实现一体化数据管理

摘要:本文首先分析GIS数据与制图数据的特点,结合“一体化数据管理”思想,阐述如何利用Geodatabase数据模型实现一体化数据管理。

关键词:Geodatabase数据模型一体化数据管理

1引言

GIS的核心功能是实现空间数据的分析应用,地图制图只是作为它输出部分的一种形式,如屏幕显示、地图输出、基于Internet的地图输出等。因此,GIS中的地图制图功能要求较低,不需要达到地图正式出版的要求。随着计算机技术的迅猛发展,GIS在各专业领域的应用不断深入,地图制图与GIS逐渐分离,导致我们建设的很多空间数据库只能采用两套数据分别提供给地图制图和地理分析,从而也带来了数据重复生产,数据冗余,数据更新等一系列问题。只有解决空间分析和数字制图两大应用需求间的矛盾,才能使GIS更实用、功能更完善。

目前,空间地理信息数据标准、规范基本完善,数字制图技术有了长足发展,而且地图制图与空间数据生产操作的对象都是地理信息数据,其生产流程中都具有采集、编辑和更新的环节,因此,空间数据生产、建库与地图制图一体化具有可行性,可以节省大量的人力物力,减少重复劳动,提高成果质量。本文首先分析GIS数据与制图数据的特点,结合“一体化数据管理”思想,阐述如何利用Geodatabase数据模型实现一体化数据管理。

2建库数据与制图数据分析

在GIS中,建库数据是指反映空间地理实置、属性、拓扑关系的数据,建库数据将空间对象抽象成点、线、面三种几何类型,建库数据具有标准的分类与编码,标准分层、图形要素具有连续性,具有完整的属性信息。制图数据是指最终以地图产品进行输出的数据,地图信息靠图中的地图符号、注记、地图整饰传达,图形数据均以制图规范规定的各种点状、线状符号表示。制图数据分层比较简单,图形数据呈碎化、不连续的形式,这种数据能够满足用图者特定的用途,但不符合GIS入库数据要求。前者注重对地理实体空间性、特征性的反映,侧重于空间信息和属性信息;后者注重从形式上对地球表面形象、直观的描述,侧重于地理实体的几何信息,其核心是实体的符号化表达,缺乏对属性数据的支持。具体而言存在以下三方面的差异。

(1)数据连续性。GIS表达的数据模型是连续的,即一个完整的空间实体对应GIS数据库中的一条完整记录。而对于数字制图来说,为了达到制图规范和美观要求,通常需要将完整的空间实体人为断开,建立多个地图目标,如等高线遇冲沟、居民地等,道路和桥梁、城镇相连,河流被桥梁、水库大坝所分割,河流与境界线叠置等。

(2)数据完整性。当前GIS系统中空间数据有很大一部分来自对原有数字制图数据的处理,采集时按照地图表达规范进行,数据不完整,达不到空间分析的要求。如在数字制图中,通常以街区的房屋边线作为道路边线,因此导致了道路信息的不完整。对于这种只绘制一条线,作为两个或多个对象公有边的情况,在制图数据中还有很多,导入GIS软件后,还需要进行大量的编辑修改工作,才能满足GIS分析的需求。

(3)数据结构不同。制图数据只关注图形的几何表达,缺少属性数据。目前基于CAD软件开发的数字测图软件,可以达到很好的制图效果,但不能很好的支持非空间属性的存储,另外不能建立复杂的拓扑关系。而GIS数据是由空间对象和非空间属性共同组成的抽象实体。

通过以上分析,建库数据强调地理空间信息的完整性,强调其独立的地理意义,而地图制图为了符合制图规范的要求,往往无法保持数据完整性的地理意义。

3数据一体化思想

地图是GIS的一种表达形式。到目前为止,数字地图制图与GIS结合的应用研究尚是一个薄弱环节。如何充分利用GIS的制图表达功能,满足地图制图的需求;同时满足GIS对地理实体的位置和形态特征的空间数据分析,以及提取和传输空间信息,提供对区域和专题信息的分析、决策、规划和管理需求,在一个GIS空间数据库中无法同时满足这两种应用需求。

传统解决这个问题的方法是建立两套数据库,一套作为地图绘制使用,另一套作为地理分析使用,这种解决方案有如下弊端:数据重复生产,既耗费了人力物力,又产生了大量数据冗余;在数据更新过程中,需要更新两套库中的数据,难以进行一致性维护。因此,本文提出“一体化数据管理”思想:数字制图是空间实体的符号化表达与信息的可视化,只建立一套GIS核心要素数据库,通过核心要素派生制图数据,基于GIS的制图表达功能实现地理实体的符号化表达。

从当前空间信息科学发展的趋势看,目前已完善的大量空间地理信息数据库标准、规范以及在全国范围建立的大量数据库,都以GIS的核心功能――空间分析为应用目标,一体化数据管理思想的前提是认为数字制图是地理信息要素的风格化展示,其核心内容是建立一套基础地理信息数据库,把制图数据看作核心数据库的一种应用。

4Geodatabase数据模型的应用

4.1常用数据模型的比较

GIS若想在一体化制图技术中大显身手关键在于如何构建一体化的数据管理机制。由前文所述,GIS数据是由制图数据和入库数据两部分组成,所以以往的数据管理机制是采用文件目录结构,把图形和属性数据分开存放的方式。

例如最开始出现的CAD数据模型,它将点、线、面等几何要素以二进制形式保存于文件中,把相关的颜色、形状、注记等属性也存放在一起。虽然CAD强大的图形编辑功能对GIS行业的贡献功不可没,但其不能很好表征地理数据属性的弱点,对一直强调空间数据分析与描述功能的GIS系统而言显然难以胜任。

随后出现的Shape数据模型,该格式解决了CAD在数据表征上的不足,通过DBASE表的方式实现了将属性信息与空间数据的连接。但是没能实现拓扑特性。于是Coverage数据模型应运而生。

Coverage模式在充分吸收Shape的优点后增加了拓扑特性。Coverage的出现确实不负众望,其可扩展定义属性表的功能,很好的处理了属性信息与空间数据的关联,可直接建立拓扑关系的思想,使GIS系统的空间分析能力得以实现,其优越的表现一度取得GIS行业家喻户晓的地位。

然而计算机技术发展迅速,“面向对象”的技术已日趋成熟并且在各个领域都得以应用,GIS行业也不例外,而且GIS技术发展到ArcGIS平台,已经将现实世界的物质实体完全抽象成“点、线、面”,这时Coverage的局限性就会显现出来,它不能把同一类型的不同要素与其各自的行为相对应。例如,同是线类型的河流与管线,在Coverage模式下很难区分各自的行为,在现实世界中管线的行为可以是移动,而河流却很难移动它的行为可以是流量增减。用“面向对象”的方法解决应该创建“对象”,让“对象”与其行为产生关联。这就是Geodatabase产生的原因。

Geodatabase是ESRI公司在ArcGIS8引入的一个全新的空间数据模型,是数据库技术和面向对象技术结合的产物,可以说它既是在关系型数据库基础上发展起来的统一的空间数据库,也是在一体化数据存储技术发展的基础上建立的新型数据模型。它的出现为GIS数据的统一管理提供了一个公共模型框架,实现了GIS对空间地理特性的统一描述,使之更接近于我们对现实世界的认知。

Geodatabase的出现并没有取代Coverage,而是对Coverage的一种完善,其实回顾GIS数据模型的发展,不难发现,每一种数据模型技术的出现都是对前一种技术的继承。在项目需求越来越细化,功能要求越来越全面的今天,谁也不能要求一种技术能够完全独立实现,无论是现在还是未来,永远都是多种技术并存互相影响互相合作的关系,人们能做的就是合理的利用它们。

4.2 Geodatabase对数据的存储和管理

从Geodatabase的体系结构也能得出这样的结论:Geodatabase是ArcGIS用于管理数据的数据模型,也是存储空间数据的数据库。它对数据的存储和管理功能由ArcGIS平台和RDBMS共同完成,它对数据的存储和检索在数据存储层实现,而对信息处理是在应用层完成,这就是Geodatabase的两层体系结构。

在ArcGIS平台上,大量GIS格式数据被集合存储于Geodatabase不同的数据集中,Geodatabase将数据集分为三种类型:属性表、要素类和栅格数据集,用户组织运用地理信息都是基于这三种基本数据集类型。Geodatabase采用标准关系型数据库技术能将空间数据存储在多种数据库中,例如Access、Oracle, SQL以及IBM DB2等,满足不同数据量和不同数量用户访问的多种需求。它存储的内容包括属性数据的表格和空间坐标,还有这些地理数据集的模式和规则。在Geodatabase中是以表格的形式存储三种数据集和其他元素的,在地理数据集中空间表示以矢量要素或者栅格要素形式存储,每个要素类被存储为一个表,每行记录代表一个要素,用表的列存储传统的属性字段和几何对象。

Geodatabase对数据的管理机制就是利用这些关系型数据库管理系统的二维表存储功能和SQL等强大的查询语言对表的操作功能,来实现对海量数据和多用户并发访问的GIS数据集的管理。

4.3 Geodatabase的数据集

(1)表

在二维表中存储地理对象的属性和特征,用于显示、查询和数据分析。

表的基本信息包括行,所有的行都有相同的列。每个列存储一个具体的数据类型,如数值、日期或者字符类型。一个列的数据类型定义了它可以存储数据的种类,因此,属性的性质是用列表达的。和传统数据库一样,关系在表数据集中也占有相当重要的地位,这时要以每个表中都有的一个公共的列做为唯一标识也就是关系类,用于使一个表中的某一行与另一个表中的某一行产生关联,然后运用SQL查询语言实现对表的操作。

在Geodatabase中支持很多数据类型存储和管理属性列,包括数值类型、文本类型、日期类型、二进制大对象类型(BLOBs)和全球唯一标识码(GUIDS)[13]。其中数值型包括long integers ,short integers,单精度浮点型,双精度浮点型;BLOBs管理和储存二进制信息,如几何图形和符号;GUIDS负责存储注册式样的字符串,在一个或多个Geodatabase中唯一标识一个表中的行。

(2)要素类

在Geodatabase中具有相同几何类型和属性的要素被存储在要素类中,常见的要素类有点(Points)、线(Lines)、面(Polygons)和注记(Annotation)四种。根据要素的空间表达不同分别以矢量要素或者栅格要素形式存储,其中矢量要素就是在现实世界中最常见的有固定形态的,最为直观的地理实体。

一个实体就是一个要素,存储为一个存储要素类的表中的一行,将实体的性质特征存储为这条记录的属性或字段,由Object ID列存储每个要素的唯一标识符。

一般来说,要素类除了常见的四种类型外还有维度(Dimensions)、多点(Multipoints)、Multipatches等要素类型。维度一般应用于建筑设计中,用来标注两个建筑物实体的实际空间距离。多点用于管理大量的点集合,这种点集合通常包括数以万计的点。Multipatches是3D的几何图形用于表达任何形态的要素的表面和外形。

(3)栅格数据集

在栅格数据集中存储地理要素,通常是采用一组规则的网格来表示,每个网格都用以表示这个位置要素的属性。一般正射影像、数字高程模型都被存储在栅格数据集中。栅格数据集通常为要素存储四种地理属性:实际坐标、参考坐标也就是地图上x、y轴的位置,每个网格的大小,行列的数量。这些属性可以为参考和解释栅格数据提供帮助。

在Geodtabase中,还有其他大量的元素信息存储在表中,用以扩展数据集类型,例如与要素行为建立的连接,数据的完整性等,增强Geodtabase对数据的管理能力。

5结语

总体而言Geodatabase吸收了数据库以及面向对象等最新的技术,所以在考虑、理解以及设计一个Geodatabase的时候就应该重新回到数据库以及面向对象等技术本身,在充分理解了二者基本的理论的时候才能很好的将我们本身的Geo的东西加到上面,毕竟Geodatabase相对于以前的若干种数据格式而言更想一个八面镜,如果单从某一方面看它都是非常的美丽的,但只有将相关的基本原理理解透彻之时才能真正的跳出三界外,不在五行中,到那时才能看到它的全貌,才能真正领略到它的美。当然,所有的新事物接受起来我们都不能一口吃个胖子,也是需要时间需要一个迭代的过程的。

目前ArcGIS引入Geodabase,只是对Coverage等数据格式的补充和促进,而并没有立刻取代Coverage之意,当然也是不可能取代得了的,直至今日,仍然是CAD、SHAPE、COVERAGE并存的时代。我们应该清醒的看到:CAD、SHAPE、COVERAGE完全能够满足项目工程、各类应用的需要,也就是说目前还没有产生如当年CAD向GIS过渡的那种渴望的热情,但是这也类似于面向过程向面向对象转换的程序设计一样,酒香不怕巷子深,在充分享受到其带来的种种优势之后,时代终究会接受强者,这绝对不是偶然。这是唯物主义发展观最基础理论的应用。

所以我有理由相信,如果面向对象和数据库技术得以蓬勃发展,必然是Geodatabase大胜之时,Geodatabase的发展空间必然不可估量。

上一篇:浅谈遥感影像信息提取的方式 下一篇:梁场低成本建设技术方案探讨