数据仓库设计与展现

时间:2022-10-11 10:46:17

数据仓库设计与展现

摘要:随着信息时代的到来,信息资源在人们日常生活中扮演着越来越重要、甚至不可缺少的角色。信息的复杂化需要用科学的方法对其进行有效的数据整理,并能快速有效的从不同角度分析、判断信息,从而提高信息的全面性、准确性、高效性。随着科技的发展,数据仓库有了更深层次的应用,数据仓库充分展示了处在信息时代的重要作用。本文对数据仓库的原理、思想以及通过报表工具,对如何进行数据和图表的展现进行了粗浅的论述。

关键词:数据仓库;原理;思想;应用;报表

中图分类号:TP311.13 文献标识码:A文章编号:1007-9599 (2011) 09-0000-02

Data Warehouse Design and Show

Zhu Mingjie

(Shanghai Economic and Informatization Commission,Information Center,Shanghai200003,China)

Abstract:With the information age,information resources in daily life plays an increasingly important,even indispensable plex information needs of the scientific method with its efficient data processing,and can quickly and effectively from a different point of view,to determine the information to improve the comprehensiveness of the information,accuracy,efficiency.With the development of technology,a deeper level of data warehouse applications,data warehouses demonstrating an important role in the information age.In this paper,data warehousing principles,ideas,and through reporting tools,data and charts on how the show has been superficial discussion.

Keywords:Data warehouse;Principle;Thinking;Applications;Report

一、数据仓库的原理

数据仓库,英文全名是Data Warehouse,也可缩写为DW或者是DWH。事实上,数据仓库这个名称并没有一个固定的、完全统一的定义。而现在被用的最广泛的应该属数据仓库概念的创造者W.H.Inmon在自己的作品中――《建立数据仓库》对数据仓库的定义:数据仓库就是面向主题的、集成的、相对稳定的、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程。而后虽然学者对数据仓库的概念有着不同的定义,但是归根结底,在这些学者的观点中,都对数据仓库所持有的特征看法基本是一致的。

(一)数据仓库是面向主题的

主题就是在高层次上将数据进行归类,并与另一个分析环境想对应,这个分析环境也就是指在使用者通过数据仓库来进行决策时所最关注的对象。

(二)数据仓库是集成的

数据仓库中的数据是由各种不同、分散的初始数据根据所需要的数据进行的分析,筛选,提炼,最终通过加工整合而成,最终进入数据仓库。所以在建立数据仓库的过程中,数据集成可以说是最细致也是最难的一个重要步骤了。

(三)数据仓库是相对稳定的

这里所描述的数据仓库的相对稳定是针对数据仓库的应用而言。在对子数据进行整合吸收后,这些数据并不能改变更新,用户只能借用数据进行分析,而不能改变原始数据。所以说数据仓库的稳定性表明了数据读取格式为只读。

(四)数据仓库是随时间的变化而变化的

在前一段中有提出数据仓库的稳定性是对应用而言。但这并不意味着数据仓库中的数据是一成不变的,随着时间的变化,数据仓库会增加一些新的数据、删除一些陈旧数据以及整合一些与时间相关的数据。这也正说明数据仓库是随时间的变化而变化的,这也反映了数据仓库的历史变化,而企业通过数据的变化更能准确的进行分析和预测,从而降低企业风险,进一步提高企业效益。

二、数据仓库的思想

数据仓库中存在着很多优秀的思想,这些思想都非常值得数据库设计者和软件设计者用来参考。数据仓库的核心思想之一就是面向主题。正如前面所言,主题是在高层次上将数据进行分类,并与另一个分析环境相对应,此环境是使用者在通过数据仓库进行决策时所关注的对象,而这种对数据的关注倾向正好反映了使用者的需要,这种需求提供了可靠的依据,所以说主题是数据仓库需求的构成因子,一个好的数据仓库离不开多个好的主题。

三、数据仓库的应用

(一)数据仓库应用的现状

目前,政府、各行业、众多企业都开始建立本单位的数据仓库体系,包括政府决策支持系统、银行信息系统、电力系统以及全国各大连锁店等。可以说数据仓库的应用是比较广泛并且迫切需要的。在建立本单位的数据仓库体系时,是通过各路相对独立、不同的子数据加以数据抽取、转换而后输入到所建立的数据仓库当中。这些数据与单位自身的内部信息有效的相结合,从而为单位更好的分析经营环境提供了比较准确的数据依据,也为单位的正确分析预测进行了准确的技术保障,同时相应减少了单位的经营风险,提高了管理水平和决策效率。

(二)数据仓库应用存在的问题

事实上,国内数据仓库应用与预测带来的效益还是有一定差距的,显而易见,在我国数据仓库的应用还存在着一定的问题。

1.数据仓库的利用率并没有预期高

数据仓库设计者没有面向主题,没有根据需求建立数据仓库,导致数据仓库的利用率并不高。不少企业花费了很长人力资源、物力资源精心设计数据仓库却得不到相应预期的效益。根本原因是市场的需求分析有缺陷,没有根据市场需求设计而是仅从企业自身出发,从而导致数据仓库的使用人群很少,在运转数据仓库过程中用户并不多。当然这与企业的管理水平也有关系,我国企业的管理水平本身是有缺陷的,由于这个缺陷致使在收集来的子数据很多没有发挥作用,没有有效联系起来,最终导致数据仓库的利用率低。

2.信息体现形势不够丰富,过于单一

由于数据仓库应用以OLAP以及固定报表为主,OLAP,联机分析处理,虽然是从不同的角度进行观察,这些观察是从分析人员、管理人员或执行人员对原始数据进行的转换,但是这种方式并不能使信息统一化,完美化。而固定报表,仅仅是在原有处理过的数据仓库中的基础上进行一次重复,所以导致数据仓库中的信息表现方式不够丰富,太过单一。很明显,这样并不能给数据仓库带来应有的效益,不能发挥它最大的应用价值。

3.数据仓库的应对不够灵活

数据仓库的特征之一是随时间的变化而变化,数据仓库对一些新增的需求需要灵活的应对适应。而对新增的需求又要进行抽取、转换、清洗,这对数据仓库有一定的冲击,导致数据仓库进入疲惫状态。然后由于子数据的问题以及所存在的某些技术问题、管理水平、投入力度不大导致数据仓库系统不稳定。

(三)数据仓库的应用方法

根据数据仓库应用所存在的问题,可以将数据仓库的应用方法重点归于两大类,一种是根据需求,另一种是提高技术。

1.根据需求

根据需求来设计数据仓库,从而提高数据仓库的利用率。而这种需求与传统意义上的OLTP系统需求是不同的,传统的OLTP系统需求是指依据事务处理的逻辑上进行收集、整理、分析的。而数据仓库应用的需求是成功建立一个数据仓库必不可少的一部分,这要求应用的需求必须是经过整理并完善起来的。一个比较优秀的数据仓库应用系统应该是不断循环的过程,而这个过程的实现就需要需求的推动。

所以说确定需求起点是至关重要的,例如保险企业,在构建保险公司管理指标体系时就要以需求为起点,再确立主干、支干、叶片。例如可将承保、核保、报案理赔这些业务归纳为主干,而支干可以是管理人员、统计人员这些工作角色,而以签单数量这些数据指标作为叶片总结起来就可以构成保险公司管理指标体系。一个成功的管理指标体系加上技术部门的加工之后,更能有效的将各部门联系起来,更加清楚的指导各业务部门有效的操作,使技术以及业务人员更加清晰明了使用,从而更大更有效的发挥了整个数据仓库的优势。

2.提高技术

根据数据仓库的设计首先是必须要有一个数据体系的整体规划。而数据体系的规划要注重数据模型的建立。由于子数据发展大相径庭,相互独立,在各个方面都有很大的不同,这些外部数据与单位自身内部数据很难达到均衡统一,所以是很难实现理想化地数据模型。在数据模型建好之后要加强前端的应用系统的建立,以便更便捷的进行业务分析。在管理层方面,因为数据是变化的,外部环境的变化也是相当迅速的,数据仓库应该加强对数据动态变化的适应性。这就要求规划好数据体系,及时将静态和动态的数据进行管理,并逐步完善数据仓库的管理体系。

四、数据仓库展现工具

目前而言,国内市场上的数据仓库展现工具是琳琅满目的,但是其功能多数是一样的,所以在选择工具上,用户都还是要有自己的标准。首先是交互性,所谓交互性就是指用户在使用的时候不再是电子死板输入的方式,不必为寻找某个数据全篇翻查,而是通过报表的智能分析,进行简单的输入操作就能实现分析要求。在比较流行的报表工具中,Crystal Report和Style Report作为两家成熟的商业报表软件供应商在交互性技术上存在着比较明显的优势。另外一个好的报表工具还需要有易用性、扩展性、可靠性以及完整性等特征,国内比较流行的报表工具有润乾报表、BI@Report等。那么这些较为流行的报表工具是如何进行数据仓库的数据图表展现的呢?

数据和图表的展现是非常重要的,它展现的合理性直接影响着用户是否能简单明了的读懂数据和图表表示的含义价值,能否更好的应用数据,从而提高使用者的兴趣、发现数据的价值。相反,如果展现方式不明了简洁,则会挫伤用户的耐心以及下次使用报表的兴趣。报表主要展现的是数据的值、数据发展的趋势以及数据构成的比例等信息,数据发生的变化以及异常都只能通过报表来体现。而数据仓库在进行数据和图表的展现时主要是通过两种方法:一种是现在我们最通用、最常见的WEB报表,WEB端的报表可以直接通过常用的浏览器登录进行查看,最为广泛运用的就是Business Objects等这些分析工具;而另一种就是在客户端的数据基础上展现,最普及的就是Excel,利用Excel的数据透视表功能可以很好地展现多维数据库MDDB中的数据。

图1.上海市经济运行决策分析数据仓库,多维展现图

五、结束语

本文通过对数据仓库原理和存在的特点、核心思想以及在当代数据仓库应用过程中存在的问题,针对问题提出应用方法解决措施,分析了比较流行的报表工具和用户在选择报表工具中所考虑的标准,以及对报表数据图表的展现方式进行了粗浅的论述,提出了一些自己认为有效可行的方法。在这个科技快速发展的时代,随着我国的数据仓库应用范围的不断深入,管理水平的提高,相信通过长期经验积累,数据仓库设计在更富创造性更具特色的同时,将会给政府提供更高效的决策分析依据,给企业带来更多的经济效益、更高的质量管理水平。

参考文献:

[1]陈京民.数据仓库原理设计与应用[M].北京:中国水利水电出版社,2004

[2]彭木根.数据仓库技术与实现[M].北京:电子工业出版社,2002

上一篇:Crazy Talk在影视动画节目制作中的应用 下一篇:P2P文件传输软件的设计与实现