电信行业数据仓库逻辑模型构建研究

时间:2022-07-11 02:20:23

电信行业数据仓库逻辑模型构建研究

摘要:近些年,我国电信行业数据仓库的发展迅速,作为数据仓库中的一个关键的环节,数据仓库逻辑建模就显得越来越重要。文章以我国电信行业数据仓库发展的背景为基础,依据数据仓库逻辑建模的原则,探讨了我国电信行业企业级数据仓库模型构建中的几个关键的部分,并结合事例对各部分进行了描述,为数据仓库工作者重构了一个数据仓库逻辑建模的过程。

关键词:数据仓库 逻辑模型 维度建模

中图分类号:TP311.13 文献标识码:A 文章编号:1007-9416(2012)07-0099-02

随着信息技术的飞速发展,电信行业经营分析数据越来越庞大,伴随着数据的急剧增加,人们对数据处理的要求也在不断的提高,数据仓库的构建在企业运营的过程中正越来越受到重视。由于电信行业中各企业的非常业务复杂,数据也非常庞大,所以在构建电信行业企业级数据仓库的过程中就必须要注意在满足不同用户需求的同时也定要兼顾系统运行的效率以及后期的可扩展性。这样构建的数据仓库才能更加适应企业的需要以及时代的发展,而要想构建一个令人满意的数据仓库,数据仓库逻辑建模就起到了非常重要的作用。

1、数据仓库逻辑建模的原则

模型可以帮助我们更加明白的了解业务需求,是在企业分析完业务需求之后所做的第一步工作,也是数据仓库中非常重要的一个环节。由于电信行业业务复杂,数据庞大,所以数据仓库的逻辑建模显得尤为重要,在进行数据仓库逻辑建模的过程中,必须要以以下几点为原则:

1.1 操作的简单性

由于数据仓库最终的用户不一定具有较高的计算机操作能力,因此数据仓库创建后对于使用过程应该具有直观,简单的特点,使得非计算机专业的人员也应该很容易的来获取自己想要的数据。

1.2 业务的全面性

业务应该能够满足不同用户的不同需求。对于同一类用户,应该能够提供全面的业务分析展现,使用户能够自由的访问自己需要的数据。

1.3 高效率原则

对于数据获取的过程,应该尽可能的缩短访问的时间,在短时间内将用户需要的数据展现给用户,提高用户的感受度。所以在逻辑建模的过程中应该注意以下几点:

(1)增加适当的冗余来提高系统的响应速度。

(2)尽量避免多个大数据量的表间连接。

(3)尽量避免大范围的数据扫描。

(4)充分考虑可扩展性。

由于电信行业业务的复杂多变,在数据仓库逻辑建模的过程中要充分的考虑电信业务后期的变化,即逻辑建模时要充分考虑系统的可扩展性。

2、电信行业企业级数据仓库模型的构建

常用的数据仓库逻辑建模主要包括三范式建模和维度建模,三范式建模偏向于数据的存储,是围绕主键与于其它属性之间的关系而作出的建模。维度建模偏向于数据的分析,如常见的星型模型建模,它是以事实表为中心,周围关联很多维表。三范式建模和维度建模各有优缺点,根据电信行业业务的复杂性和庞大性,为提高企业数据的处理效率和数据分析的灵活性,以及后期数据仓库的可扩展性,本文采用维度建模的方式进行分析,系统部分模块的模型如图1所示。

系统数据仓库的逻辑建模可分为以下几个步骤来执行。

2.1 确定主题

从大的模块上来说,系统分析的主题包括业务主题,客户主题,其中业务主题包括企业提供的各种复杂的业务,业务的开通取消情况,业务的生效情况,业务的收费情况等,客户主题主要包括客户的基本情况,客户订购的业务信息,客户订购业务产生的费用信息,以及企业为客户提供的服务信息等。图2列出了系统主题间的关系。

2.2 确定度量

度量即分析的指标,是数据仓库中数据分析结果的直接体现,它决定着数据分析的结果是否符合业务需要,对企业的决策支持起着非常重要的作用,因此度量的确定也是非常重要的。

以客户基本信息为例,包含的度量值主要为客户id,客户姓名,客户年龄,客户电话,所在区域,所在行业,客户类别等信息。通过这些信息能够为客户的流失分析及客户营销分析提供基本的资料,当然还有一些度量是需要通过计算得到的,如客户的平均收入,客户的平均消费等,这些需要计算的度量在数据仓库的分析中也是非常常用的。

2.3 确定粒度

粒度是数据仓库中保存数据的细化程度,并与细化程度成反比,细化程度越高,粒度级别就越低;反之越高。粒度的划分将影响数据仓库中的数据分析操作,例如以区域为例,如果区域的划分只到省的级别,那么我们就无法分析省中各地市的数据信息。但如果把所有要分析的信息都使用低粒度进行保存,将浪费很大的空间,并影响分析的效率,所以,在系统粒度的设计中,使用多重粒度设计,即按照实际分析的需要划分不同的粒度级别。图3为系统粒度的部分实例。

2.4 确定维度

维度是描述数据仓库中事实数据的一种层次性结构,是分析数据的角度。维度的合理定义对数据的灵活展现起着至关重要的作用。

在电信行业中,维度的选取大同小异,例如,若以客户分析为主题,那么维度常划分为区域维、时间维、行业维等,每一维上又细分成具体的维,如时间维上可划分为年、季度、月、日,区域维上可划分为南北方,省,市等。

3、总结与展望

数据仓库建模在企业数据仓库的构建过程中起着非常重要的作用,通过建模,能够使企业的分析面向业务主题,使得分析出来的数据更加贴合实际;通过建模,能够简化后期的统计分析工作,提高开发的效率。本文以数据仓库建模的原则为基础,分析了电信业企业级数据仓库模型的构建的过程中需要做的工作,并对所做的工作进行了简单的描述,能够提高后期数据仓库的开发效率,增强数据仓库系统的可用性,为电信业企业的决策支持提供帮助。

参考文献

[1]米波.基于数据仓库技术的银行数据系统的研究[J].电脑知识与技术,2010(06).

[2]周冬婉,周伟,叶涛.企业数据仓库多维数据模型的建立[J].微机发展,2005(06).

[3]Anand S Kamble. A Conceptual Model for Multidimensional Data[C].Proceedings of the Fifth on Asia-Pacific Conference on Conceptual Modelling,2008.

[4]徐琴,彭宇扬,彭自成.电子商城的数据仓库建模研究[J].计算机与现代化,2010(07).

[5]高翔,刘峰,张殿东.商业银行数据仓库建模研究与设计[J].计算机与数字工程.2010(08).

[6]高翔.数据仓库中多维元数据的组织研究[J].信息与电脑,2010(06).

作者简介

陈立勇,男,1982年5月出生,计算机专业硕士研究生,助教,主要从事数据仓库方面的研究。

上一篇:基于自平衡超远距离油井测试系统研究 下一篇:基于Cent OS操作系统的虚拟机应用系统设计探究