超市商业智能模型研究

时间:2022-04-26 06:13:46

超市商业智能模型研究

摘 要:针对超市这种商业企业经营决策的需要,以某POS系统为例,在不影响超市POS系统运行的前提下对POS系统的数据库进行少量修改,进而设计出数据仓库、多维数据集、数据挖掘模型和报表模型,通过商业智能门户向企业数据分析人员和经营决策人员提供操作简便、界面好的平台。关键词:商业智能;数据仓库;OLAP

中图分类号:F2 文献标识码:A 文章编号:1672-3198(2007)08-0087-02

1 引言

随着竞争的加剧,POS系统在零售企业中得到了广泛的应用。POS系统和联机电子秤等极大地提高了前台销售和盘存的速度,并可以随时打印各项报表,使得零售企业的日常管理实现了信息化,为企业积累了丰富的、比较完整的能反映企业经营过程的数据。为了充分利用大量历史数据,各零售企业开始建设数据仓库系统,在商品分析、销售分析、库存分析、客户分析等方面取得了一定的成功。但是目前零售企业的数据分析存在一定缺陷:

(1)对客户的分析有一定的片面性。我国零售业(超市)的客户多数是居民,超市POS系统可以记录居民的姓名、年龄、地址、电话、职业、受教育程度等基本信息。客户信息记录的是会员个人的信息,但使用会员卡的可能是家庭的任何成员。目前的POS系统中没有记录这些家庭信息,从而导致客户分析的不准确。

(2)货架分析。目前的POS系统记录了每一笔销售,但没有记录商品销售前所摆放的货架。需要分析商品在不同货架的销售情况时因为缺少这个信息而无法进行。

(3)目前零售业的数据分析系统一般采用DW+OLAP+DM的结构,主要以C/S的模式实现,一般要求用户对数据和模型比较熟悉,主要供数据分析人员使用,而企业经营决策者因为对数据和模型不熟悉而不能自如使用这个系统。

综上所述,对原POS系统的数据库进行适当修改以适应数据分析的需求,用商业智能系统对DW、OLAP、DM进行整合并利用商业智能门户向使用者提供统一的界面有十分重要的现实意义。

2 商业智能的概念

商业智能(Business Intelligence ,简称 BI)的概念最早是GartnerGroup 的Howard Dresner于1996年提出来的。当时将商业智能定义为一类由数据仓库(或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的技术及其应用。商业智能可以说是提高企业市场竞争力的一种技术手段或方法论,一般包含数据仓库、联机分析处理、数据挖掘三个部件。

3 数据仓库设计

3.1 超市数据仓库的主题分析

根据前面的分析,我们可以确定以下几个主题:

(1)销售主题:对销售情况进行多维分析,以发现销售数据的异常变化并追溯原因。

(2)商品主题:对商品的进销存及退货进行分析,为超市进行商品品种和品牌调整分析提供数据。

(3)客户主题:对客户的购买情况进行多维分析,以分析客户的购买习惯、计算客户的价值、进行客户流失预测等。

(4)货架主题:位置不同,货架的租金也不相同。通过分析不同类别在不同货架的销售及利润,为超市调整商品而已提供支持。

3.2 超市数据仓库逻辑结构

确定了数据仓库的主题后,就要根据主题设计主题的逻辑结构。在上述主题中,销售主题、客户主题和商品主题可以设计成雪花结构,而供应商主题、货架主题可以设计成星型结构。这些模型通过公共维度表形成星座模型。

4 对源系统数据库的修改

如前所述,目前POS系统提供的数据与实现数据仓库各主题所需的数据相比存在一定差距,这是因为POS系统中数据定义不全面造成的。但POS系统是一种典型的OLTP系统,高效准确地处理销售事务是它最重要的功能,它不会为了满足分析处理的要求而增加额外的功能从而降低系统运行效率,而企业也不必要为了满足分析环境的需要就废除现有的系统重新开发或者购买新的POS系统。一个折衷的办法是对现有系统的数据库进行修改以适应分析环境的需要。

4.1 客户信息的补充

OLTP系统一般是通过存储过程实现对数据表记录的追加,可以直接修改表的结构和存储过程实现客户信息的补充。某POS系统的客户信息表包含以下字段:编号、名称、电话、传真、地址、邮编、联系人、开户银行、帐号、备注;其增加客户记录的存储过程:INSERT INTO会员表(会员卡号,姓名,折扣,累计金额,性别,生日,身份证号,电话,地址,邮编,备注,换算金额)VALUES (@P1,@P2,@P3,@P4,@P5,@P6,@P7,@P8,@P9,@P10,@P11,@P12)上面的SQL语句完整地以参数形式给出了添加的数据项以及对应的字段,因此给客户表增加字段不会影响该语句的功能。同样对查询、更新、删除客户信息的存储过程进行分析,发现只要不删除表中现有字段及改变字段定义,给表添加字段不会影响现有功能的使用。

为了增加客户分析的全面性,满足客户主题分析的需求,可在数据表中增加所需要的字段:教育程度、家庭人口、与超市距离等;另外增加一个存储过程以向数据库的客户表写入客户的这些补充信息,并在后台增加一个程序界面以调用该存储过程实现新客户信息的录入功能。

4.2 货架数据的补充

如果POS系统没有货架信息,就必须先在数据库中建立货架信息表,并给商品表中每种商品加上所处货架字段一般而言,同一种品牌的同一个类(系列)商品是摆放在一个货架上的,所以只需要在商品类别表中加上货架信息,通过类别表与商品表之间一对多的关联与以及类别表与货架表之间的多对一关系就可以为商品和货架之间建立联系。

在商品入库时设置好商品的分类,当调整货架后,在商品类别表中更新货架信息。将数据加载到数据仓库时,不仅要加载每一笔销售业务,也需要根据类别表将每件销售出去的商品的货架信息写入数据仓库,作为外键与货架维度表相关联。

5 OLAP及挖掘模型的建立

根据前面主题分析的结果,本系统建立了商品、销售、客户、货架等四个OLAP模型。

本系统采用SQL Server 2005+Microsoft Visual Studio 2005开发。用SQL Server Business Intelligence Development Studio建立多维数据集和数据挖掘模型,用Reporting services展示数据。SQL Server 2005 Reporting Services(SSRS)是一种基于服务器的解决方案,用于生成从多种关系数据源和多维数据源提取内容的企业报表,能以各种格式查看的报表,以及集中管理安全性和订阅。它可以从多维数据集中动态取得数据,支持切片、下钻、上卷等多维操作,并能以图形方式展示结果数据;此外它还为开发人员提供了若干编程接口。

在数据挖掘方面,使用Microsoft SQL Server 2005 Analysis Services (SSAS) 提供的关联算法对交易清单进行挖掘;用聚类算法对客户进行划分;用线性回归算法分析商品销售随季节变化的规律,并依此规律评价促销效果;用决策树算法对客户购买习惯进行分析。

在信息展示方面,利用商业智能门户提供了一个统一的展示平台,将数据挖掘的结果、联机分析处理的操作及结果在简洁的门户站点中显示出来,这个门户还支持数据报表的与获取。

6 结束语

本文提出的模型主要是供企业内部经营管理人员和决策人员使用。由于该模型采用模式,只在加强对使用者的身份验证,对与供应商和客户相关的数据和模型进行适当调整,该模型也可以通过Internet向企业的供应商和客户开放。

参考文献

[1]陈京民.数据仓库原理、设计与应用[M].北京:中国水利水电出版社,2004.

[2]刘智,桑国明等.基于数据仓库连锁店决策支持系统模型的研究[J].计算机与数字工程,2005,(8),22-24.

上一篇:投资者心理偏差的深层心理机制 下一篇:论电力企业统计人才的选拔