数据仓库与决策支持系统研究

时间:2022-07-05 04:19:13

数据仓库与决策支持系统研究

摘要:主要介绍数据仓库的有关概念和决策支持系统的一般框架,并在数据仓库的基础上提出了案件处理决策支持系统的数据模型和功能结构。

关键词:

数据仓库;案件处理;数据挖掘与联机分析处理

中图分类号:TP

文献标识码:A

文章编号:1672-3198(2010)16-0318-01

0 引言

决策支持系统(DSS)是在管理信息系统的基础上发展起来的,在数据仓库(Datawarehouse)、联机分析处理(OLAP)技术和数据挖掘(DataMining)工具出现以前,DSS 使用的数据库(DB)只能对原始数据进行一般的加工和汇总,致使决策所需信息不足,难以满足DSS的需要。随着计算机的普及和信息技术的迅速发展,信息量的激增,各领域管理人员的有效决策需求,决策支持系统在数据库、知识库和人机交互方面得到了长足的发展。目前开发的综合DSS是以数据仓库技术为基础,以联机分析处理和数据采掘工具为手段进行实施的一整套解决方案,这一解决方案正在应用于各行各业的管理决策中。当今社会,社会治安案件和刑事案件成多元化发展,种类繁多,使得公安部门对于案件的处理造成一定的影响。而网络迅猛发展,基于公安内部网络的案件联查性有了更高的要求,需要实时更新案件的发展以及犯罪嫌疑人资料查询、追查等。本文提出了基于数据仓库的一种解决方案。

1 数据仓库原理概述

数据仓库概念创始人W.H.Inmon 对数据仓库的定义为:数据仓库就是面向主题的、集成的、稳定的、不同时间的数据集合,用以支持经营管理中的决策制定过程。所谓面向主题,是与传统数据库的面向应用相对应的;所谓集成的,是因为数据仓库中的数据来自于组织不同系统的面向应用的数据;所谓不可更新,是指一旦某个数据进入仓库以后,一般情况下将被长期保留;所谓随时间变化的,是指数据仓库中的信息并不只是关于组织当时或某一时点的信息,而是系统记录了组织从过去某一时点到目前以及顺沿的各个阶段的信息。

数据仓库的主要功能就是将决策支持系统所需要的信息从日常的营运数据中抽取出来,把分散的、难于访问的营运数据转化为集中统一、随时可用的信息,同时提高了访问和处理数据信息的速度和效率。数据仓库的提出以关系数据库、并行处理和分布式技术的飞速发展为基础,目的是解决在信息技术发展中存在的拥有大量数据、然而有用信息贫乏的问题。数据仓库并不是一个新的平台,而是一个新的概念,它仍然建立在数据库管理系统基础上。数据库是一种通用的平台,用来管理企业的数据;而数据仓库则是某一问题解决方案的实施过程。数据仓库不是可以直接购买到的产品,主要是一个问题的解决过程。数据仓库中通常包含原有的详细数据、当前的详细数据、低度概括数据、高度概括数据和元数据等信息。

2 基于数据仓库决策系统一般框架

数据仓库技术、联机分析技术和数据挖掘是作为三种独立的信息处理技术出现的。数据仓库技术用于数据的存储和组织,解决了DSS系统的数据库内数据不一致的问题;联机分析技术为用户提供了数据在线分析模型;数据挖掘则致力于知识的自动发现,三者并没有内在的依赖关系。但是这三种技术却有内在的联系性和互补性,为了充分发挥它们各自的特长,可以将它们结合起来,提出一种通用的DSS构架,即以数据仓库为基础、将OLAP和DM紧密结合(DM + OLAP +DM = DSS) 的一整套可操作、可实施的解决方案。这一综合解决问题的实施方案,可以使决策者运用OLPA或DM工具对已提炼过的信息进行多维分析,从而实施有效的问题解决决策。

3 基于数据仓库的案件处理信息分析和决策

3.1 案件处理分析系统的特点

在案件处理信息分析中,所有的信息传递都是计算机在网络技术环境支持下进行的,总队与总队之间,支队与支队之间,通常都是非直接接触的,时间通常是异步的,空间通常也是分离的。在案件分析处理过程,往往都是调用数据库里的资料。

为了便于信息查询,提高案件侦破速度,采用数据仓库原理和技术对这些数据进行存储和处理是一种可行的方案。这些数据来源于公安内部网络, 多数都是非结构化和半结构化的,运用数据仓库的数据预处理技术来进行数据的标准化处理和清理工作,把教学数据和反馈数据进行整理送往数据仓库数据库;运用数据仓库的管理层来对这些数据进行管理;并运用OLPA或DW工具,按照案件分析需求进行分析和采集数据,从而为各种治安和刑事案件有总体划分,并对犯罪嫌疑人的信息进行归类,方便查询。

3.2 数据来源与分析

系统数据主要是来源于各总队网络织所积累的大量数据。这些数据来自于每个支队的数据库,主要包含案件的种类,大小,时间,地点等。按照数据分析和教学决策的需要,数据仓库可按如下主题组织:案件种类,案件大小,案件发生时间,案件发生区域,将数据仓库中相关数据集合转换为多维数据库。建立种类维、大小维、时间维和区域维。种类维以“治安”和“刑事”为粒度来划分;大小维以“大案”和“小案”为粒度划分;时间维以“年”和“月” 为粒度划分; 区域维以“ 省”、“市”为粒度划分。在我们使用的中间数据库的引擎是关系数据库引擎,而我们所追求的却是基于多维空间的分析操作,所以需要一个逻辑模型将二维平面的中间数据库数据映射为多维分析所需要的多维空间的数据。另外,我们应当允许用户自由地定义该逻辑模型,也就是自由地组织多维空间的各个坐标轴以及各坐标轴上的粒度。我们只需要提供一个定义该多维模型的工具以及完成从该逻辑模型到中间数据库平面数据的映射即可。

3.3 系统数据模型和功能结构

系统采用“星型架构”来表示多维概念模型,采用星型模型的数据库中至少包括一张“事实表”。“事实表”中的每条记录都包含有指向各个“维表”的外键和一些相应的测量数据,即度量值。对于每一维都有一张“维表”,“维表”中记录的是有关这一维的属性。该系统的功能结构采用C/ S体系结构,由客户机、应用服务器和数据仓库服务器构成。客户端采用Java Applet实现用户界面,OLPA和DW在应用服务器中实现。底层数据库/数据仓库在数据库服务器端实现。客户端用来向决策者信息或提交查询并返回结果。应用服务器处理应用逻辑,必要时从数据库服务器获取数据,再向客户端返回结果。数据库服务器处理案件数据的清理、转换和形成各类案件数据集合,以及案件处理分析数据仓库的更新维护。

4 结束语

数据仓库技术为决策支持的发展提供了一套有效可行的体系化解决方案,它是解决问题的过程,而不是一个可以获得的软件产品。本文采用数据仓库的原理与技术, 尝试着进行案件信息分析, 只是给出一个一般意义上的解决框架。一个完整的DSS数据仓库解决方案应集成了数据仓库、OLPA和数据挖掘三种信息处理技术,有利于推动各类案件的分析处理,提高案件的侦破速度。

参考文献

[1]王珊.数据库和联机分析处理[M].北京:科学出版社,1998,(8).

[2]周龙骧.数据采掘技术[J].计算机世界, 1998,(5).

[3]余华鸿.数据仓库与决策支持系统[J].一线技术,2000,(6).

上一篇:第三方物流企业物流信息管理系统探析 下一篇:先简支后连续组合梁桥设计计算及应用范围