基于数据挖掘的交通数据管理平台

时间:2022-06-04 04:22:38

基于数据挖掘的交通数据管理平台

摘要: 数据库在交通领域的广泛应用使得该领域积累了大量的数据,这些数据间存在着潜在的规则和关联,通过数据挖掘技术的应用可将这些潜在的规则和关联显性化,对交通管理的决策有着重要的作用和意义。本文构建了一个基于数据挖掘的交通管理平台为交通管理决策提供支持,并说明了该平台数据挖掘的流程。

关键词: 交通管理数据挖掘平台

中图分类号: N37文献标识码:A

一、引言

目前公安交通机关为方便交通管理业务的开展,创建了四个基本数据库:道路交通事故信息数据库、驾驶员(即驾驶证)管理信息数据库、交通违法行为信息数据库、车辆登记管理信息数据库,当前交通管理部门的应用系统、平台均以此四个基本数据库为基础获取各类信息。数据库自创建以来经过几十年数据的存储,已积累了海量的交通相关数据,随着车辆和驾驶人增多以及相关业务的复杂化,数据更是成爆发式增长。这些数据已成为交通部门的重要的数据财富。

然而面对大量数据,显然已不能再满足于只是简单地查询和修改数据,而是进一步希望能够发现数据之间的潜在关系,并随着现实中交通管理中“人、车、路、环境”和谐发展的迫切期望以及缓解交通堵塞、预防交通事故的职责所在,交通管理部门急切地希望通过快速处理这些数据获得进一步有利于科学管理的决策依据。特别是以往的交通管理规律常常不是基于数据库中信息丰富的数据,而是基于决策者的直觉,因为决策者缺乏从海量数据中提取有价值知识的工具,即使当前的专家系统技术,通常这种系统依赖于用户或交通管理领域专家人工地将知识输入知识库,因此这一过程可能会产生偏差和错误,并且耗时、费用也高。如何才能对大量数据进行分析,发现数据之间的潜在联系,为交通管理提供自动决策支持呢,运用数据挖掘技术从交通管理数据库中寻找知识发现给交通管理部门带来了希望。

在这些海量交通数据中存在着大量的有着潜在关联和规则的数据,因此将数据挖掘技术中的关联规则算法应用在交通领域,通过关联规则挖掘发现交通数据之间的潜在关系,为交通管理提供自动决策支持有着重要的意义。本文设计了一个交通管理数据挖掘平台方案,并对平台架构和挖掘流程进行了详细分析和讨论。

二、交通管理数据挖掘平台架构

在交通数据库中,所涉及的违章信息、驾驶员信息、机动车信息比较繁琐。交通数据的特点是:交通数据库的核心业务表较多、表的定义复杂、表中的数据量大、表数据的实时更新速度快。数据间的潜在关系和规则未被发现和利用,目前的处理还是停留在见到的统计报表,没有智能性的分析处理。这些交通的原始数据对于交通管理决策支持有限,需要设计一个基于数据挖掘的交通管理数据挖掘平台对交通数据进行有效的挖掘和分析,对交通决策提供有力的支持。图1给出了我们所设计的交通管理数据挖掘平台框架,该平台主要由三部分组成:数据仓库模块、数据分析处理模块和接口与会话管理模块。

1、数据仓库。在辅助决策方面,数据仓库能为其提供高质量、纯净、集成的数据,从而极大地提高决策支持系统的性能与信息分析能力,因此,数据仓库业已成为进行数据分析与挖掘的基础平台。构建交通信息数据仓库是本系统结构的核心,其实现形式包括:数据采集与ECTL(数据抽取、转换和装载)、数据仓库管理系统、元数据管理系统三部分。本系统采取星型模型建模,其中,主题是其基本组成单位,每个主题由多个事实表和维表组成,而一个事实表可以关联多个维表,构成一个以事实表为中心的星型结构,多个星型结构共同组成一个主题。在建模过程中,考虑到智能交通领域涵盖范围广泛,要求数据仓库具有很强的可伸缩性:既可以集成智能交通领域交通流采集系统、信号控制系统、电视监控系统、违章取证系统、公路车辆监测系统、122接处警系统、GPS车辆定位系统、可变情报板显示系统等各个应用系统提供的交通信息,又可以针对特定应用系统。

图1 交通管理数据挖掘平台框架

2、数据分析处理模块。在数据仓库基础上直接采用的智能化分析技术主要有:联机分析处理、数据挖掘和知识发现技术。联机分析技术的主要功能是进行多维数据分析和生成报表,专门用于支持复杂的分析操作,侧重对高层管理人员和决策人员的决策支持,可以应分析人员要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观易懂的形式将查询结果提供给决策人员。本模型将数据仓库中建立的多维逻辑视图直接映射到数据立方体结构上,以方便对预计算产生的数据进行快速索引,当数据集稀疏时,采用稀疏矩阵压缩技术提高存储效率。通过对数据立方体(DataCube)进行下钻(Drill-down)、上卷(Roll-up)、切分(SliceandDice)以及旋转(Pivot)等操作,实现不同角度、不同层次的数据分析,例如:对交通负荷时空分布信息运用联机分析技术处理,通过切片、切块、旋转细剖低级别的详细数据和统揽较高级别的概括性数据,快速地响应查询。数据挖掘与知识发现技术是从海量数据中抽取隐含的、潜在的有用知识的过程。许多专家学者倾向于把数据挖掘视为知识发现过程中的一个步骤,在本系统模型中,为强调这两种技术各自特点和侧重点的差异,将它们分别列出。知识发现的基本步骤为:第一步,数据的准备;第二步,数据挖掘;第三步模式评估;如果评价人员不满意,重复执行上述步骤,否则,转下一步;第四步,知识表示。

3、接口与会话管理模块。该模块通过可视化技术,提供易于被用户理解和使用的,具有智能纠错、自我学习的界面系统,并提供自然语言和人类思维方式与计算机之间进行转换的功能。当系统在产生相应的决策后,该模块可以按照有关智能交通应用子系统的指令格式生成相应的指令供决策者直接调用。

三、交通管理数据的挖掘流程

交通数据挖掘的过程大致上可分为五层:底层为交通管理数据库,包括违章信息库、驾驶员信息库、机动车信息库等等,在这些库里存在许多交通信息,直接对这些数据进行挖掘是不现实和不可取的,因此,构建了上一层主要是数据预处理层,这一层是对交通数据库进行适当的有选择的筛选和处理,将少量主题相关和用户感兴趣的数据提取出来组成二维表,然后在此基础上得到第三层概化后的数据,在这一层上我们可以利用这些概化的数据构建我们的数据仓库。对交通数据的具体挖掘就是在这一层上进行的,最上面两层是知识发现的过程,通过具体挖掘之后的得出的模式和分析后找到对于交通决策有效的模式。图2给出了交通管理数据的挖掘过程。

图2 交通数据挖掘流程图

参考文献

[1] 朱建秋,数据挖掘平台及其关键技术研究[D],上海:复旦大学博士学位论文,2002.5.

[2] Jiawei Han, Micheline Kamber,数据挖掘概念与技术[M],北京:机械工业出版社,2004.8

[3] 赵群礼,关联规则数据挖掘方法的研究和实现[D],西安:西安科技大学硕士学位论文,2005.4

上一篇:城市燃气工程规划 下一篇:浅析桥梁工程施工要点