浅谈空间数据质量管理

时间:2022-05-08 04:41:57

浅谈空间数据质量管理

摘 要:随着测绘技术的不断进步和空间数据库的日益庞大,空间数据已经发展成为GIS的血液,它的质量将对于数据交换、共享和使用都有很大的影响,同时也将直接影响着GIS应用、分析、决策的正确性和可靠性,因此空间数据质量问题越来越受到广大用户的关注,如何对其进行有效的质量控制,对其进行全面、科学的度量和评价显得越来越重要。本文利用其中的“土地利用现状数据库建设”项目,探讨空间数据质量管理的重要作用。

关键词:空间数据 国土资源信息化 数据质量管理

中图分类号:P208 文献标识码:A 文章编号:1672-3791(2013)07(a)-0020-02

1 研究背景

1.1 空间数据及信息化

随着现代地理信息技术的发展、信息共享速度的加快和空间数据应用领域的不断扩大,特别是当通过对空间数据的分析,来支持辅助管理、设计、规划或决策时,由于它的空间分析功能与决策作用主要依赖于GIS中的空间数据,因此,空间数据自身的质量将显得越来越重要,它的优劣程度将直接影响GIS分析与决策的结果。因此,对空间数据进行质量控制研究,保证空间数据的质量,就是为GIS生存和发展提供保障,同时也将对各类不同部门的决策和减少GIS设计与开发的盲目性等方面有深远的影响。

20世纪70年代以来,由于微电子、软件技术的重大突破,推动了信息技术的迅猛发展和广泛应用,引发了一场新的全球性信息革命。信息技术已经成为继蒸汽机技术和电力技术之后,又一项对经济社会发展产生深刻影响的通用性技术。信息化水平已成为衡量一个国家和地区现代化水平的重要标志。

加快信息化建设,这是国土资源管理在新形势的迫切需要。目前,国土资源管理的任务更加艰巨,形势十分紧迫。工业化和城市化加速扩张和有限的土地资源、矿产资源的矛盾日渐加大;关于资源利益方面的诉求一直高居不下,土地资源的非法使用、乱采滥挖矿产资源的现象仍然严重;在经济全球化的发展背景下的国土资源利用开发,市场经济条件下资源配置的问题亟需要破解……面对前所未有的压力,国土资源管理部门认识到应尽快并且是必须建立一个全新的管理理念,通过应用现阶段的全世界的日新月异的技术,提高管理的效率。这其中,信息化无疑是最重要、也是最有效的举措。

1.2 问题所在

国土资源信息化是一个巨大的工程,涉及到矿产、地籍、测绘等多个行业。具体要实现的有遥感影像数据库建设、地质基础数据库建设、土地利用现状数据库建设、办公业务网络系统建设等,每一个都是庞大而复杂的系统工程。而国土资源信息化的特殊性,如“高精度”、“庞大复杂”、“下工序需使用上工序的结果”、“工期长”等决定了在项目开展之前就必须做好质量先期策划,“土地利用现状数据库建设”中土地变更调查项目数据量繁冗,变更性质复杂,耗时长,如何运用质量管理的方法进行科学的管理,掌握有效地调查变更情况,准确的做出应对变得非常迫切。其产生空间数据是海量的,如何有效管理,保证数据质量就成为国土资源信息化发展必须面对的迫切问题。

2 数据质量定义及空间数据的特点

2.1 数据质量

数据质量是数据对于明示和隐含的应用需求的满足程度;可从两个方面来理解数据质量的定义。

(1)数据本身的质量。

数据的真实性。所谓真实是指数据反映真实情况,如土地利用动态监测表中一条记录“序号:15,使用性质变化:农田变建筑用地,面积:1200 m2”,而对应的现实情况却是该公司第15号地块,面积为2100 m2,这种问题是很难通过数据检查来发现的。所以一般情况下只能默认数据真实。

数据的完整性。数据完整是指记录完整、变量完整、值完整;记录完整是指数据中包含了研究所要求的全部个体。数据的自洽性。数据必须能够满足这种数据之间的关联关系,而不能够相互矛盾。数据的真实性、完整性、自洽性是数据本身应具有的属性,称为数据的绝对质量,是保证数据质量的基础。除了数据的绝对质量外,还有我们在利用和存贮数据的过程中所产生的数据质量,包括使用质量、存贮质量和传输质量,称之为过程质量。

(2)数据的过程质量。

数据的使用质量:数据的使用质量是指数据被正确的使用。再正确的数据,如果被错误的使用,就不可能得出正确的结论。

数据的存贮质量:数据的存贮质量是指数据被安全的存贮在适当的介质上。所谓安全是指采用了适当的方案和技术来抵制外来的因素,使数据免受破坏,备份是我们常使用的技术,包括异地备份和双机备份等,美国的9.11事件和2004年底发生的印度洋海啸事件使越来越多的企业领导意识到备份尤其是异地备份的重要性;所谓存贮在适当的介质上是指当需要数据的时候能及时方便的取出。

数据的传输质量:数据的传输质量是指数据在传输过程中的效率和正确性。在现代信息社会中,数据在异地之间的传输越来越多,保证传输过程中的高效率和正确性非常重要。

2.2 空间数据特点

空间数据时对现实世界地理试题进行有效描述的数据,对空间数据进行质量控制研究,保证空间数据的质量,就是为GIS生存和发展提供保障,同时也将对各类不同部门的决策和减少GIS设计与开发的盲目性等方面有深远的影响。各项数据纳入计算机管理,高速发展的信息化建设也对数据采集的质量提出了新的要求。除了普通数据要求的真实性、完整性、逻辑一致性、确定性等一般性质量特征之外,还存在其本身的一些特点。

(1)数据种类繁多,质量要素复杂。

土地属性的描述有很多种形式,如形状、大小、坐标、面积以及影像等。要充分保证空间参考系使用的正确性、位置精度的准确程度、属性精度准确程度、正确性完整性、对数据结构、属性及关系的逻辑规则的遵循程度、要素时间属性和时间关系的准确程度、影像、栅格数据与要求的符合程度、对几何形态、地理形态、图式及设计的符合程度、各类附件的完整性、准确程度。因此土地资源各类数据库都相当的繁杂,国土资源信息化更是一个巨大的工程,涉及到矿产、地籍、测绘等多个行业。具体要实现的有遥感影像数据库建设、地质基础数据库建设、土地利用现状数据库建设、办公业务网络系统建设等,每一个都是庞大而复杂的系统工程。

(2)数据时效性要求较高。

由于测绘、国土工作都是根据《中华人民共和国测绘法》以及相关的法律法规进行的,因此各项业务数据的采集工作必须按照法律法规的有关规定进行,超过规定时间所采集的业务数据在管理工作所起到的作用将会大打折扣,因此要求数据采集和对问题数据的修改在规定时限内完成。例如,在耕地面积调查工作中,土地使用人应当在实施细则规定的时限内进行申报,相关的数据信息就必须在这个时限内完成采集,如发现申报错误,也必须及时进行纠正,否则会造成数据失真,影响到上级部门的决策。

(3)数据采集和利用具有权威性。

权威性是指数据质量符合法律法规、国家标准要求的程度。数据的权威性取决于国土部门工作质量的科学性、权威性。需要采集到国土信息系统中的数据以及加工、输出的数据,均是国土部门及其工作人员依法行政的一种表现形式,数据质量均要符合一定的法律、法规的要求,如果数据质量不符合相关的法律、法规的要求,就说明国土部门及其工作人员在一定程度上没有依法行政。当前我省国土部门开展阳光服务,能实时、自动提取现行信息系统中储存的执法活动记录,通过预先设定的各项考核指标和过错行为,对执法数据进行分析和比对,自动生成考核结果,并可追踪到具体岗位和人员,发出执法通报;还能自动根据执法基础数据筛选疑点,提供执法监察的立项线索。通过该系统执法人员可以据此发现执法过错,并及时进行纠正;考核部门通过系统定期采集指标数据,并进行考核、追究。如果数据质量存在差错,相关工作人员将会根据错误的数据作出错误的行政执法行为,引起行政诉讼等执法风险。

3 数据质量存在的主要问题与改进

3.1 质量现状

多年来,已经采集了大量有用的土地利用变化的基础数据,适应“批、供、用、补、查”的国土资源管理新形势,满足土地管理日常业务的现实需求,实现监管方式从“以数管地”到“以图管地”的重大转变为评估、监控和管理决策提供了优良的信息资源,但是也有部分数据由于存在错漏或与应用要求不符而没有利用价值,这些数据的存在造成了大量的数据冗余,造成数据传输效率降低,拖慢了系统运行的速度,更重要的是一些错误数据的存在会导致相关应用软件无法运行,例如曾经发生因为县市代码录入时全省代码设置不规范,结果导致新开发的耕地面积变化趋势分析软件运行一段时间后出错的情形。

3.2 主要问题

(1)土地变更调查记录表。

该登记表录入信息有近20项,因其录入变更前、变更后的权属单位名称、地类编码、权属等大量信息,且需录入全省所有县市,录入工作量大,差错率也相当高,占总差错量的80%以上。大量漏录、缺项发生在该环节。

(2)建库动态调整统计表。

县市申报表,目前我市对在窗口申报的申报资料未当场全部录入,该环节数字录入多,中文少,差错数占总差错数的9%左右。差错数据经常产生在各申报数据的逻辑关系不匹配上,工作人员只能自行判断,故容易产生差错。

(3)其他类。此类差错主要为文书流转中各类文书的录入,文件信息类数据录入,系统故障产生的数据差错等,此类差错发生较少,只占总差错率不到5%,由于该部分录入数据量不大,故差错率比例较低。该部分主要是由于系统模块间数据审核不严,操作人员未按相应流程操作造成差错。

3.3 质量改进

质量管理的最终目的是为了保证数据的准确性、条理性以及最终提高基于数据分析而做出的决策的合理性。对现存数据进行相应修改只是手段,更重要的是要在修改过程中查找出造成这些差错的原因及其预防措施,为数据质量零差错的目标提供经验参考,在进行项目质量设计时,要包含相应的记录。根据以上分析作出数据质量改进项目的工作分解结构如图1。

数据质量改进项目经过了深入调研、需求分析和软件开发、指标分解和数据修改、修改反馈、质量考核等五个阶段。

确立了“把住入口、过程控制、持续改进”的数据质量管理基本思路,要求所有部门和个人都树立“下一个过程(环节、部门)是顾客”的观念,不仅要为外部顾客提供好服务,也要为内部顾客提供好服务。

同时还建立了以数据流为主线的流水线式的质量责任制,主要环节或岗位要对所经过数据的质量承担相应的责任,保证上一环节的“不合格品”流入到下一环节,尽量把活动和相关的资源都作为过程进行管理。利用数据质量监控软件对录入数据进行检测,每周检测一次,每个月的最后一周每天检测一次,对检测出来有问题或有疑问的数据根据录入职责返回相应的管理岗位工作人物进行核实、纠错。

4 结语

空间数据和一般的数据有较大的区别,具有明显的空间特性,是描述地理试题和地理现象及过程的数据。相关内容的复杂性、数据海量,造成空间数据类型复杂多样,且空间数据间还有复杂的拓扑关系,对于空间数据的质量管理一直是地理信息系统、测绘广泛应用面临的主要问题。这个是今后亟需改善,无法逃避的问题。质量管理能保证海量空间数据的高效运用,本文对空间数据管理遇见的问题进行分析,通过数据质量改进的实践对空间数据质量管理进行实证研究,总结出空间数据质量管理的重要性,以及在空间数据管理中的必要性。

参考文献

[1] 沈鸣.上海市国土资源信息化质量管理实践[J].国土资源信息化,2010.

[2] GB/T 18316-2001数字测绘产品检查验收规定和质量评定[S].

[3] 龚新云.浅谈测绘项目管理[J].华东师范大学学报,2007.

[4] 刘纪平.海陵空间数据组织与管理初探[J].中国图像图形学报,1998.

[5] 李晓印,张友顺,杨昕,等.空间数据的“无纸化”管理初探[J].国土资源科技管理,2004.

上一篇:样品调节时间对卷烟物理指标的影响 下一篇:板集矿清淤泥浆泵户外条件下自动排水装置提高...