信息融合技术在企业运行预警系统中的应用研究

时间:2022-10-09 01:41:42

信息融合技术在企业运行预警系统中的应用研究

摘要:为了实现企业的良好快速发展,采用信息融合技术为企业的发展作出预测以及对于已经隐存的问题及时的作出预警,对于企业的发展已至关重要。本文分析了基于聚类融合算法以及相应的改进算法,并分别应用于企业运行预警系统中,得到企业运行发展模型,为企业未来的发展走向做出预报或警示。最后以某企业的发展数据进行验证,并将两种融合算法得到的结果进行比较。

关键词:信息融合技术;预警系统;企业运行

中图分类号:TP277文献标识码:A文章编号:1007-9599 (2011) 24-0000-02

Application Research of Information Fusion Technology in Enterprise

Movement Early Warning System

Zhao Xin

(Wuhan University,School of Information Management,Wuhan430072,China)

Abstract:In order to make the enterprise develop better and faster,It’s important that making a prediction on the enterprise’s development condition by using information fusion technology,which can make early warning about the recessive existing problems in time.In the paper,clustering fusion algorithm and its improved algorithm were analyzed,and were applied in the early warning system of enterprise’s operation,we got enterprise’s development model.At last,the model was proved by an enterprise’s operation datum,the two fusion algorithms were applied and compared.

Keywords:Information fusion technology;Early warning system;Enterprise developing

一、引言

企业发展的过程中,生产产品的数量、产品的销量以及人员的数量等信息的波动对企业的发展影响是非常大的,如果波动幅度过大,会对企业带来巨大的损失。为保证企业能够持续、良好运行发展,本文提出了企业运行预警系统。为企业未来的发展走向做出预报或警示。

近年来,信息融合技术已经成为国内外的研究热点[1]。聚类分析是数据挖掘的一个重要研究领域,它是一种无监督的学习方法,通过一定规则将数据按照定义的相似性划分为若干个类,这些类由许多性质相似的数据点构成的,同一个类中的数据彼此相似,与其它类中的数据相异。聚类融合算法是聚类分析中一个新兴且重要的研究方向,于2002年由A.Strehl和J.Ghosh正式提出,但在2001年A.LFred就已经进行了类似的研究。聚类稳定性、准确性和有效性是聚类分析领域中被广泛研究的问题[2]。

本文详细介绍了一种基于划分的聚类融合方法,以某企业2001-2009年中的数据作为信息源,利用聚类融合算法对该企业近期数据进行分析、融合得出企业未来时段的生产、销售及运行情况,计算出该企业的运行发展模式。并且给出了一种改进的聚类融合算法,以解决该聚类算法仅在划分某些特定数据集时效果较好的不足和难以确定聚类数的问题。最后分别将利用两种算法得到该企业2010年的运行发展预示,并和2010年该企业真正的发展模式进行比较。验证该预警系统的可行性。并将两种算法得出结果进行比较,论证利用改进的聚类融合算法得到的模型更为准确、可行。

二、聚类融合算法模型

(一)基于划分的聚类融合算法。算法的基本思想是:给定要构建的划分的数目k,首先创建一个初始划分,然后采用一种迭代的重定位技术,通过对象在划分见移动来改进划分[3]。常用的著名算法是k-means和-medoids。也可称为k均值聚类算法[4]。

(二)企业预警系统模型分析。根据某市某企业提供的数据信息,获取2001-2009年间共108个月份中企业的主要信息,抽取出18个指标:人员增加数量,员工开支,产品1产量,产品2产量,产品3产量,产品4产量,产品5产量,产品1销量,产品2销量,产品3销量,产品4销量,产品5销量,产品1成本,产品2成本,产品3成本,产品4成本,产品5成本以及其他因素。将这些信息归纳为产品种类、产品数量、各类产品的销量、各类产品的成本、人员变动、工资开支和其他外因共7个方面的数据统计信息,通过应用三角函数提取周期法提取该企业的循环的主波,按照下述方法计算该企业运行发展波动的综合值序列。

求第i个指标的波动循环因子 ;求第i个指标的标准化因子: ;求标准化波动因子: ;宏观经济波动综合值序列: (设 是第i个指标剔除季节因子后的序列)。

表示各类影响企业运行发展状态的经济特征为:

A类:各种特征指标绝大多数处于最低位置或次低位置时,企业发展处于低谷状态,应该提前预警。

B类:如果产品产量增加而产品销量降低时,即第三类向第二类转换时,销售市场存在问题或者市场中的产品有过剩现象,要提前发出预警。

C类:企业具有稳定发展的特征,即各指标所占的位次保持在第二位或第三位,并且各指标没有太大的波动,这种模式属与运行发展的良好模式。

D类:产品成本投入升高而产品数量下降,其他各指标相应波动不大的情况,可能是由于其他外因,例如市场原材料价格上升或社会外力因素进行调控等。这类模式属于黄灯区,要保持警觉。

E类:各个指标都处于高峰,表示企业发展运行处于高潮期,产品销量高,但是投入也相对很大,相对来说各个指标都处于特殊的活跃期,但是这种情况一般很短暂,随之而来的是企业运行的大幅度波动,应尽量避免这种情况发生,所以也要提前预警。

(三)对企业运行模式聚类。设 , , 分别表示第j个指标在第i时期去掉季节因子的速度值序列,波动因子,标准化因子。 表示第j个指标的标准化因子[5]。

则(其中n为样本个数)

(其中k为特征指标个数)

如果将初始分类定为k类,则对第i个样本点的计算公式为:

如果该结果为m,则将第i个样本点归为第m类( )。

(四)修改初始分类。由于类与类之间可能有模糊区,所以,如果要对该模糊区中的样本确定其最佳的属性归属类别,就需要修改初始分类[3]。

设 分别表示n个样本点的坐标行向量,初始分类为k类: ,对应的中心坐标分别为 。每类的样本数分别为 ,用l(i)表示 所属的标号,定义 与 的距离为 ,即可得到:

定义分类函数 。通过该方法是分类函数达到最小的一种分类结果。即把历史数据中各时期的综合值所达到的区间分为若干个区间段,则同处于一个区间段的样本在这时可能是扩张期,也可能是收缩期,因此同处于一类的样本处于那个时期要结合未来的运行发展模式得到。

以前面所述中筛选出的7个特征指标每个月份的值作为一个样本点(共108个),用前面讲的聚类方法聚成5类,每个样本的计算结果如表1所示。

表1 样本计算结果统计

1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月

1 4.3 4.4 4.5 4.28 4.3 4.36 4 4.4 4.46 4.66 4.6 4.5

2 4.33 4.3 4.61 4.6 4.7 4.65 4.69 4.7 4.66 4.71 4.7 4.6

3 4 3.8 4.1 4 4.3 4.15 4.2 4.3 4.2 4.2 4.3 4.26

4 4.42 4.5 4.6 5.3 5.28 5.15 5.13 5.1 5.2 5.4* 5.6 5.3

5 4.6 5 5.6 6.8 6.75 6.7* 6.83 6.6 5 5.6 5.56 5

6 4.4 4.9 4.2 3.8 4 4.2 4.1 4 4.3 4.5 4.6 4.5

7 4.7 5.2 5* 4.6 5.1 5 4.78 4.8 4.73 4.7 4.91 5

8 4.9 5.8 5.76 5.7 5.66 5.5 5.46 5.6 5.8 5.9 5.5 6*

9 5.06 6.1* 6 5.6 5.3 5 4.8 4.2 4.6 4.5 4.6 4

(五)确定模式边界识别函数。利用多维空间坐标系统,将7个特征指标建立坐标系,企业运行模式在该多维空间坐标系中构成了5个区域,每个区域都有自己的界限,样本点落在哪个区域就表示企业运行处于何种模式。由判别函数非得到该企业的5类模式为: 。

如果要判断第j期的企业运行模式,只需要把第j期的特征指标的值代入判别函数,即可得到其所属的模式。如果要判别未来时段的运行模式,根据特征指标的曲线建立与其相适应的预测模型,将预测值代入识别函数判断其所属的运行发展模式。

(六)系统检验。根据该企业提供的2001年-2009年中每个月的数据作为样本的实际值代入模式识别函数确定的运行模式和该企业实际运行模式比较发现,共有5个样本点有偏差(表1中带*号)。其中2个与实际运行数据偏差较大,另外3个实际数据基本接近。

三、基于改进的动态聚类融合算法

(一)改进方法。传统基于划分的动态聚类融合算法中的聚类个数k的选取以及相应的k个聚类初始中心点的选取都是随机的[5]。如果该聚类个数k选取不当,很容易导致聚类运算所得到的结果差异偏大(如表1中加星号的表示偏差数据)。

为了克服这些缺点,先考察不同的聚类个数k下的聚类成员之间的差异度,以及这些聚类成员在不同的权值下对融合结果的影响。即多次使用上述的基于划分动态融合算法,得到所需的聚类成员,然后对这些成员按照常规方法进行融合,并初选此时的聚类个数为目标聚类个数,用k*表示[6]。各个聚类成员的聚类个数k相应的记为 。

分析各聚类成员的聚类个数和K*的差值,以此为基础设计加权函数对聚类成员进行加权,重新计算矩阵并通过共识函数进行新的融合运算。该系统中采用的加权函数如下:

当新的聚类同其他聚类成员完全相符合时其值为0,聚类成员k值同目标个数偏差越大,差异度也就越大。对所有的聚类成员加权后,相应的所有聚类成员总的矩阵为:

其中j为改进算法循环次数, 为各次循环所得新的聚类成员的加权值。H为基本聚类算法运行次数, 为各次聚类成员, 为各聚类成员的矩阵。

(二)系统检验。和第一种方法一样,将企业提供的2000年-2008年中每个月的数据作为样本的实际值代入模式识别函数确定的运行模式和该企业实际运行模式比较发现,只有2个样本点有偏差。但这两个样本点和实际运行数据相当接近。

四、结论

本文详细介绍了一种基于划分的动态聚类融合算法和相应的改进算法,并分别将两种方法应用于企业运行预警系统中,克服了传统的企业发展模式中按照波动周期的四个不同阶段(扩张期、收缩期、波峰、波谷),引起的不该报警时报警,该报警时又不报警的现象。同时根据应用两种算法得到的预警模型的得到的数据分别和真实数据相比较,通过实验的方式得出改进的算法更实用与企业发展预警系统中。

参考文献:

[1]郭.基于信息融合的交通信息采集研究[D].北京:中国科学技术大学博士论文,2007:3-10

[2]赵法信,王国业.数据挖掘中聚类分析算法研究[J].通化师范学院学报,2005,26,2:11-13

[3]万志华,欧阳为民,张平庸.一种基于划分的动态聚类算法[J].计算机工程与设计,2005,1,2:177-179

[4]谢颖.信息融合中几种算法的研究[D].重庆:重庆大学硕士论文,2008:25-60

[5]王鑫,王洪国,王.数据挖掘中聚类方法比较研究[J].计算机技术与发展,2006,16,10:20-25

[6]Pawlak Z.,et al.,et al..Rough sets-the oretical asp ects of reasoning about data.Dordrecht:Kluwer Academic Publishers,2001

上一篇:计算机磁盘存储设备研究 下一篇:XML技术在数据库领域的优势\模型分析和应用模...