贵州省交通运输数据中心与数据管控体系研究

时间:2022-09-23 12:24:22

贵州省交通运输数据中心与数据管控体系研究

摘 要:以往各自为政、相互封闭建设模式带来的数据孤岛、数据烟囱现象阻碍了我省交通运输行业发展,亟需通过数据中心建设实现数据资源共享及有效利用。本文结合我省交通运输行业实际,介绍了我省交通运输行业数据中心及数据管控体系建设思路和内容,

关键词:交通运输;数据中心;数据管控体系

中图分类号:U495

贵州省交通处于大发展时期,对路网运行监测能力、运营管理效率和信息服务水平提出更高要求,而以往各自为政、相互封闭建设模式带来的数据孤岛、数据烟囱现象阻碍了我省交通运输行业信息发展,因此打破部门壁垒,建设一个可持续运行的数据中心成为了当务之急。

1 数据中心

1.1 定位。贵州省交通运输数据中心由总中心及业务分中心组成,中心物理分散、逻辑集中。总中心是全省交通行业数据标准规范中心,制定统一的数据、接口和服务标准,总中心是行业数据共享交换中心,承担行业内跨单位及与外单位数据共享;总中心是行业基础数据管理中心,承担全省交通行业核心基础数据采集、存储和任务;总中心是信息服务中心,为行业管理辅助决策及公众出行提供支撑。业务分中心存储自己相关的业务数据,是总中心数据来源及支撑,也是总中心数据共享交换的重要对象。

1.2 数据整合需求。(1)重点整合行业内基础性的共用数据,主要包括公路基础设施、营运车辆、经营业户、从业人员等基础数据;(2)整合行业内跨部门的共享数据,如高速公路管理需共享国省干线交流流量路况等数据用于交通疏导,共享道路运输“两客一危”数据打击“倒卡”现象;道路运输管理需共享交流流量路况数据用于运输线路的选择;(3)整合行业内管理决策所需统计数据,不整合行业内业务明细、过程数据;(4)整合跨行业的共享数据,如需向公安提供路况数据,从公安获取交通管制信息、车辆及驾驶员违规信息;向气象部门提供路网范围内气象监测信息,从气象部门获取城市、水文气象及气象灾害预警信息等。

1.3 数据共享交换设计。本次工程主要以下两种方式实现数据共享交换:(1)为了避免对业务局源系统造成影响,采取DataStage+CDC的数据交换方式,先由各业务局定期将业务分中心数据批量推送到前置机,再通过DataStage抽取到总中心,当业务分中心有增量数据产生时,由CDC将增量数据同步到总中心;(2)对于“两客一危”GPS监控数据,鉴于其数据量大,实时性要求高,采取WebSphereMQ和MessageBroker中间件传输实现数据交换。

1.4 数据库建设。本次工程建设了公路、营运车辆、经营业户及从业人员四大基础数据库及动态路况、行业分析、公众出行三大主题数据库。公路数据库包括公路及其沿线设施基本信息,营运车辆数据库包括车辆基本信息、二级维护、年审等信息,经营业户数据库包括经营业户基本信息、许可证、资格信息等,从业人员数据库包括基本信息及资格信息;动态路况主题数据库包括交通拥堵情况、交通阻断、养护施工等信息,行业分析主题数据库包括公路建设与养护、交通流量、通行费、客货运输量及周转量等信息,出行信息服务主题数据库包括动态路况、客运班线、气象等出行信息。随着我省交通运输行业安全应急、经济预警及分析、交通云平台、大数据建设等重大工程建设,逐步丰富完善数据中心建设。

2 数据管控体系研究

2.1 管控思路。数据中心的可持续运行离不开数据管控体系的建立,管控体系包括组织、规范、工具、考核体系,管控思路如图1所示。由信息化领导小组、信息化技术支撑单位及业务部门共同组成数据管控组织,在不同层面上结合建立的各种数据标准规范、流程及管理制度,通过元数据管理、数据质量管理系统等管控支撑工具,对数据标准执行情况、数据质量进行考核,生成考核报告,督促业务部门整改,实现数据管理的良性循环,使得数据能正常、稳定、健康地运行。

图1 数据管控思路

2.2 管控组织。管控组织由信息化领导小组、信息化技术支撑单位及业务部门共同组成。信息化领导小组负责审批数据共享申请,行业数据标准规范、管控流程及考核评价标等;信息化技术支撑单位定义数据结构、交换、存储等相关规范,负责数据抽取、共享,利用管控工具对数据标准执行情况、数据质量进行检查和考核;业务部门参与标准规范的制定,遵循相关标准,并配合完成数据质量治理工作。

2.3 标准规范及制度。在交通运输部的基础数据元标准基础上,补充我省交通运输行业特有的基础数据元,形成了《基础数据元标准》;建立了《数据中心信息资源采集规范》,明确信息资源采集范围、采集方式及采集内容,保证数据采集工作稳定、持续展开;形成了《数据中心数据交换共享使用规范》,明确数据共享交换方式、数据及服务接口方式;建立了《数据标准管理制度》及《数据标准管理制度》,明确各业务局在数据标准管理及数据质量管理中承担的责任,落实数据标准符合性检查等机制,落实数据质量问题的生成、分析、评估、解决闭环处理的机制流程。

2.4 管控工具:(1)元数据管理系统。元数据管理系统主要功能包括:1)元数据定义:实现对数据元、数据资源进行元数据定义,业务部门能快速了解数据时间及空间范围、数据粒度、数据提供单位、更新频率、使用范围及安全要求等,使数据资源可以识别并易于理解;2)数据元集合:对我省交通运输行业基础数据元标准进行管理;3)数据资源目录:形成数据资源目录,业务部门可浏览查看数据中心资源,提出资源共享申请,也可以将自身数据资源封装成webservice接口注册到系统供其他单位共享使用;4)元数据完整分析:对数据元、主句资源元数据完整性进行检查;5)术语自助学习:将行业内术语进行统一管理,用户可对其进行自学习。(2)数据质量管理系统。数据质量管理系统主要功能包括:1)数据质量规则管理:根据需要定义记录级、表级、表间关联关系等检查规则,例如非空、正则表达式、满足枚举值域等,并将数据质量规则配置到数据资源中;2)源系统变更协同管理:将所有涉及共享交换的源系统注册到系统中,若有源系统IP、接口、数据库名、表名发生变更影响数据中心质量时能及时知道;3)数据中心运行监控:能够对磁盘等空间容量进行预警,对数据共享交换任务源记录数量、隔离数据数量、入库数量进行记录,对检查的异常进行邮件通知。

2.5 考核体系。考核评价是管控体系不可或缺的一部分,将管控措施、相关任务落实情况中间过程的各个指标进行量化,形成考核评价指标,实现对数据管控的参与单位或者管控参与人员进行有效的监督和激励。

3 结束语

数据中心是一个综合性的课题,不仅仅靠技术解决,还需要一整套数据管控体系保证其可持续运行。本文结合我省交通运输行业实际,提出我省交通运输数据中心及数据管控体系建设思路和内容,下一步将结合正在开展的安全应急、经济预警分析、交通云平台、大数据建设等重大工程加大数据资源整合力度,为政府决策、行业管理、社会公众提供更好地服务。

参考文献:

[1]汪祖云.交通数据中心总体架构与数据共享交换平台的设计研究[J].智能交通系统与信息技术,2008(03):23-28.

[2]DAMA International.DAMA数据管理知识体系指南[M].马欢,译.北京:清华大学出版社,2012.

作者单位:贵州交通信息中心,贵阳 550001

上一篇:制造执行管理系统(MES)的应用探析 下一篇:提高丽水信息化发展指数的对策研究