用数据集市多维分析支持电网企业线损管理

时间:2022-10-20 04:52:22

用数据集市多维分析支持电网企业线损管理

用数据集市多维分析支持电网企业线损管理

广东电网有限责任公司江门供电局 郭平阳

【摘要】本文简述了数据集市、联机分析处理、商业智能、多维数据分析的概念和技术。提出和实现了一种利用数据集市技术和工具,对电网企业中的线损进行分析和统计的方法。

【关键词】数据集市;联机分析处理;多维分析;商业智能;线损管理

近年来,企业信息化由单纯的信息系统朝数据集市的发展,基于数据集市的管理决策逐渐成为B/S架构信息系统之后的又一热点。目前,行业领先的大公司都在建设数据集市。以数据集市技术为基础,以联机分析处理和数据分析技术为手段的企业管理信息化水平越来越高,数据集市对企业管理的支撑程度也越来越深刻。我们针对某市电网公司的线损管理,利用数据集市构建了一个基于多维分析的线损分析和管理方法。

一、原始线损管理工作模式的问题

原始的线损管理工作模式是面向生产管理信息系统的,即手工从计量自动化系统的查询页面导出数据。具体过程是:1.查询导出。线损管理人员在计量自动化系统中查询全市每条10kV馈线每天的供电量和售电量,以Excel格式导出;2.计算。因线损管理是以周为管理周期的,对于每条馈线需要累加一周内的总供电量和总售电量,从而计算该馈线该周的线损。一般以上上周六作为统计周的第1天,上周五为统计周的第7天,在本周一统计出报表;3.统计分析。统计分析的工具是Excel,使用Excel公式和数据筛选功能。最常用的分析方法是找出线损最高的馈线,分析该馈线连续四周的线损变化环比,跟踪到管辖的供电所。

这种管理模式有两个缺点:一是无法灵活的从需要的维度展开分析。比如找出一条最近线损很高的馈线后,再分析该馈线最近四周的线损变化趋势,乃至所在供电所的整体线损变化趋势就很难;二是分析工具支持力度不够。原始管理模式主要工具是Excel公式和数据筛选功能,对统计分析的灵活性支持不足。比如面对类似于迅速找出某几个供电所在本周、上周及上上周线损前5名的馈线的需求时,Excel就难以为继。线损管理人员大量的时间被浪费在数据的提取、存储与对比上。据作者了解,每周一,光是计算出每条馈线上周的线损便要花去几乎一整天的时间。

基于数据集市的多维分析工具,为线损管理人员提供强大的统计分析工具支撑,是提高工作效率和管理水平的一种好工具。

二、主要技术介绍

1.数据集市(Data Market)

数据集市(Data Market)是一种比数据仓库更小、更集中的数据集合。简单地说,在数据仓库的基础上,原始数据从数据仓库向有个性化定制需求的部门流动。也就是说,数据集市是面向部门级的数据库。某个部门的数据集合就可以称之为某部门的数据集市。例如,营销稽查部门有自己的数据集市,基建部门也有自己的数据集市,它们之间可能有关联,但在本质上互为独立。[1]数据集市是为支撑特定部门的决策分析而组织起来的一组业务规则和数据。

2.联机分析处理(OLAP)

联机分析处理是部门级的、针对共享多维信息的联机主题数据进行分析和访问的快速软件技术。[2]换句话说,它是对多维数据进行稳定一致、快速、和可操作互性的存取技术,是多维数据分析的技术实现。它允许管理决策人员对多维形式的决策数据进行深入观察,可以按照分析人员的需求灵活快速的进行海量数据的复杂查询分析,同时以一种直观形象的展示形式给决策人员提供查询结果,以便他们准确掌握部门的指标情况、经营状况,了解管理对象,做出正确的决策。

联机分析处理具有简易的数据操纵、灵活的数据分析和可视化的分析结果展示等优点,能简化基于海量复杂数据的分析,提高分析效率,加快决策进度。同时,联机分析处理的另一个优点是,它可以建立在关系型数据库上,可以与原有信息系统保持兼容。

3.多维分析(Cube)

多维分析把企业部门关心的一个指标数据或者一种产品,放到一个两维以上的空间坐标中来进行分析。在多维空间里,可以利用多维分析对数据进行度量聚集统计,可以利用多维分析对数据的特性进行分类,也可以利用多维分析对各分类之间的数据度量之间进行关联分析。[3]

多维分析的基本概念有:

1)维度:具有某类衡量基准性质的数据集合。比如时间维度,一般具有年、月、日、时、分、秒等属性。

2)度量维度:此维度上的数据代表了被衡量的对象所拥有量的大小值,可用数字来表示。比如某公司某产品每天的销售额。

3)立方体:包含维度和度量维度的多维数据结构。

4)分类:对维度中的数据从某种层次进行分类取代。比如时间维度,只从“年”这个层次去观察,2014年6月1日和2014年12月2日都属于“2014年”这个分类。按照这种分类方法,时间维度由2012年、2013年、2014年等等分类组成。

5)层次:在维度中的层次结构(一般是树形结构)。比如时间维度中,可以这样定义一个层次结构:年-季-月-日。这样,也就规定了所有季度都属于某一年,所有月都属于某一季度,所有日都属于某一月。当然,也可以根据多维数据分析的需要,把层次定义为:年-月-日。层次结构的自由定义,体现了多维数据分析的灵活性。

6)维度集合:就是多维成员确定的空间集合。

7)元素:立方体中的原子元素,可以理解是维度空间中的一点。

8)切片:过滤使用,相当于在三维空间里用刀去切,增加筛选条件,得到满足预期条件的数据。

9)成员:维度上集合中的成员。

4.商业智能(BI)

商业智能包含一揽子的方法和思想,通过基于数据的决策支持系统来辅助商业决策。商业智能是将企业的数据转化为知识的一系列概念和技术。企业的数据包括交易记录、进存销记录、订单、库存、供应链信息、客户和供应商等来自企业所处商业环境中的数据,也包括其他外部环境中的各种宏观数据。[4]面对这些复杂庞大的数据,商业智能技术提供迅速收集、管理和分析数据的方法和技术,并将数据转化为有用的信息分发到企业各部门。商业智能既可以在操作层的,也可以在战术层和战略层帮助企业做出明智的业务经营决策。商业智能综合利用数据集市、联机分析处理工具、多维分析和数据挖掘等技术。[5]

图1 系统架构图

图2 主数据模型图

图3 多维分析效果图之一

三、应用数据集市多维分析支持电力企业决策

1.开发环境

1台ETL服务器。安装Informatica 9.8.1(ETL工具)。从计量自动化数据库抽取供电量和售电量数据,以及馈线、供电所等基础信息。把数据保存在多维数据库服务器的Oracle数据库中。

1台多维数据库服务器。安装Oracle 10G、SQL Server2005(含SSAS组件)和VS2005。Oracle数据库保存从ETL服务器抽取的数据库表。VS2005提供开发环境,调用SQL Server2005的SSAS组件,读取Oracle中的数据表,组织成多维架构的数据立方体,并存入SQL Server。

2.系统架构图(见图1)

3.设计与实现

线损管理主题的主数据模型如图2所示。

在图2中,黄色窗口的是该数据模型的核心事实表,蓝色窗口的是维度表。维度主要分为两类,分别是“日-周-月-季”和“馈线-供电所-供电局”。每一类维度按照层次链接组织。

多维探索的效果如图3、图4、图5所示。

图片中报表的上方是多维分析控制区,行区代表了“馈线-供电所-供电局”的维度,列区代表了“日-周-月-季”的维度和线损度量。图3、图4和图5展示了一个快速的多维度分析过程。图3是2014年鹤山县局下属每个供电所每个季度的馈线线损表,在行区维度进行上钻操作可切换到图4的每个县局每个季度的馈线线损表,然后在列区的时间维度上进行下钻操作可切换到图5的每个县局在8月第3周的馈线线损表。报表中对线损超出预警阈值的做出告警提示。采用本文的技术可以对分析维度进行迅速转换,可自动生成报表。图5就是线损管理人员所需的馈线线损周报表。

图4 多维分析效果图之二

四、结论

本文利用们所作的一个课题介绍数据集市技术设计和实现电网企业中线损管理的信息化支撑系统,提出一种利用数据集市及工具,结合联机分析,设计和实现了线损管理的多维分析与统计。大大减少了人为计算,为业务决策人员提供了多角度、多层次查询、分析和管理的功能,使得决策人员能及时定位和发现问题,大大提高了工作效率。

参考文献

[1]ZHANG Shi-hong,QIN Hao.基于地市级数据集市的结构与模块设计[J].计算机科学,2013,z2.

[2]Zhao Bo,Ye Xiaojun.OLAP性能测试方法研究与实现[J].计算机研究与发展,2011,10.

[3]张宪乐,林逢升,邹会来.基于安卓的农产品追溯查询信息的多维分析与展现[J].安徽农业科学,2013,33.

[4]PENG Hong,li WANG Yan.基于商业智能构建高校智能体系的现状分析和研究技术[J].价值工程,2014,5.

[5]王莹.商业智能在政府决策中的应用[J].电脑知识与技术,2014,21.

上一篇:电网规划综合评价方法探究与应用 下一篇:几项紧急处理汽车火花塞的方法