织“天罗地网”保数据质量

时间:2022-09-13 01:42:25

织“天罗地网”保数据质量

交通运输统计是有关统计部门根据统计规范,收集、管理和分析交通运输的信息,并向政府、组织和公众公布信息的一整套工作。交通运输统计的范围涵盖铁路运输、公路运输、水路运输(包括内河运输和海洋运输)、航空运输、管道运输等多个方面。由于所涉及的统计指标相对复杂,交通运输统计的内容也较为繁琐,数据量较大,因此,交通运输统计的数据质量控制也是各国统计工作的研究重点。欧盟统计局关于交通运输统计的数据质量控制工作一直走在世界前列,其实践方法对我国交通运输统计工作有一定的借鉴意义。

三箭连发 设严密质量控制系统

欧盟统计局交通运输统计使用的系统是EDAMIS系统,即电子数据监管信息系统。欧盟成员国通过EDAMIS系统向欧盟统计局定期上报本国交通运输统计相关数据,同时,欧盟统计局通过EDAMIS系统下发文件信息,收集各国上报数据,对数据进行管理。在一个统计期,欧盟统计局对各国上报的交通运输数据进行三个阶段的质量控制。第一阶段:数据初始检查,第二阶段:单独成员国数据检查,第三阶段:全部成员国之间数据检查(见下图)。

第一阶段初始检查是指欧盟成员国通过EDAMIS系统上报数据后,系统会对每个成员国上报的数据进行基本的检查,其中包括数据文件的格式是否正确、数据编码是否正确,以及是否有异常值的情况。一旦出现问题,欧盟统计局会及时通知相应成员国进行检查和修正。本文重点介绍统计数据质量控制的第二、第三阶段。

严丝合缝 审单独成员国数据

对每个成员国分别提交的交通运输统计数据,欧盟统计局主要进行数据时间上的一致性检查和数据内部间的一致性检查。

数据时间上的一致性检查是指检查两个连续年度同一指标的数据增长率是否在可允许的范围内。以航空运输为例,欧盟规定了成员国航空运输相对变化量的限值,如果超过限值,欧盟统计局将对数据的真实性进行审查。根据航空运输量的不同,相对变化量的限值也是不同的,可参见右表。但是,也有成员国因为某些特殊原因,其两个连续年度数据相对变化量可能会超过表格中的一致性检查标准,例如,举办奥运会、发生突发事件等等。由于特殊原因导致的数据超过限值是允许的。

查看右表可发现,当某一欧盟成员国上一年度客运量为10000人次时,如果今年客运量大于14000人次,或者小于6000人次,那么就超出了所规定的限值,则EDAMIS系统会反馈给成员国,令其进行检查。可见,一国的运力越大,其实际反映出的连续两年的运力变化率就可能会越趋于平稳。

数据内部一致性检查,是指对不同报表之间的同一项统计数据是否一致进行检查。例如,月度数据加总值与年度数据一致性检查等。这类检查在我国的交通运输统计中也大量存在。

首尾相接 查全部成员国数据

在收集到全部成员国的交通运输统计数据后,欧盟统计局主要进行数据对应检查和数据遗漏检查。

数据对应检查用于检查在两个国家间进行的同一项交通运输活动是否在两国提供的数据上保持一致。例如,对于进行同一项水路货物运输的两个成员国,其中一个成员国的装货量与对应成员国的卸货量应该是相等的。欧盟统计局对两国之间上报的运输量的差异可接受值有明确规定。比如,对水路货物运输而言,如果计算出的两国运输量差异超过20%,就需要对两国上报的数据进行复查。

数据对应检查是从运输量的角度检查对应成员国上报数据是否一致,而数据遗漏检查是从运输活动数方面检查对应成员国上报数据是否一致。在航空运输中,数据遗漏检查用于检查运输航线数量是否准确。如果一个国际航班从成员国A起飞,到成员国B降落,被成员国A记录,但是没有被成员国B记录,那么成员国B的数据就是缺失的。

近些年,我国加强了对交通运输统计数据的质量控制,取得了较大的成效,但目前大量的数据质量控制工作还仅限于对数据格式、编码进行检查,对年度数据与月度数据汇总进行一致性比较等方面,仍然缺少更加深入、规范的数据质量控制办法。在对交通运输统计数据的质量控制上,一方面我们可以积极借鉴国际上已经较为成熟的数据质量控制规范,另一方面还要立足于我国的实际,在保证基础数据质量的前提下对数据进行更具深度和广度的挖掘。

上一篇:住宿餐饮企业招工最难 下一篇:教学小老师法在高职护理《人体形态》中的探讨