粗糙集方法在优化石油企业可持续发展力评价指标体系中的应用

时间:2022-07-27 04:23:37

粗糙集方法在优化石油企业可持续发展力评价指标体系中的应用

摘要 粗糙集是一种新型数学工具,能有效地处理模糊或不完整的信息,揭示数据的内在规律与隐含知识。本文以粗糙集理论为出发点,探讨了指标体系优化、信息系统建立、属性离散化及属性约简等相关问题。同时,以石油企业可持续发展力评价指标体系作为实证研究对象,优化了该评价指标体系,为石油企业可持续发展力评价指标体系的构建提供了一种新的方法。

关键词 粗糙集;属性约简;可持续发展力评价;指标体系

中图分类号 F224;F416.22

文献标识码 A

文章编号 1006-5024(2013)01-0071-03

一、粗糙集属性约简

(一)粗糙集的概念

粗糙集(Rough Set)是一种新型数学工具,能有效地处理模糊或不完整的信息,揭示数据的内在规律与隐含知识。粗糙集理论最早是由波兰学者Pawlak提出的。粗糙集理论的知识表达方式如表1所示。

在信息系统S中,为适合在关系数据库中存储,数据是以二维关系表(决策表)的形式表示的。关系表中的行对应对象xi,列对应对象的属性a,行与列的交汇处就对应一个具体的属性值f(xi,a),这样就可以描述论域中的全部对象的特征V。

(二)粗糙集属性约简

因为现存信息中并非所有条件属性都是必要的。因此,一方面,要更好地从海量的数据中发现有用信息,去除冗余数据,避免重复信息的干扰。另一方面要注意,有一些属性和信息虽然是多余的,但在去除这些属性和信息后,可能会影响原有的分类效果。因此,必须在有前提的情况下,去除系统中的冗余数据,对数据进行数据约简(Data Reduction),这一前提就是保留信息系统原有的分类能力的基本属性完整。

二、基于粗糙集属性约简优化指标体系

(一)优化指标体系的问题描述

石油企业可持续发展力是石油企业在石油和天然气资源开发过程中为谋求永续发展,企业应努力实现满足下游产业和消费者的需要,在追求经济效益最大化的同时合理利用自然资源,与环境和社会和谐共生,谋求本企业长期高效运行的能力。企业可持续发展力主要由管理与生产、资源储量、社会贡献、环境保护、资产状况等方面影响。

石油企业可持续发展力评价指标体系是由一系列指标的集合构成的,这个集合可以表示成U={ui,(i=1,2,∧,N)},任意一个石油企业就是其中的ui。通过综合各指标上的取值可得最终评价值IL。IL={A,B,C,D}表示石油企业的可持续发展力水平从高到低。

指标集合中指标个数较多,一些指标间相关性过高,会造成信息的冗余,影响指标的独立性。因此,对初选的指标集合进行优化就是必不可少的一个环节。

对石油企业可持续发展力评价指标集合的优化,这一环节就是在保留指标集合原有分类能力的基本属性完整的前提下,找到的一个最小子集IS,用这个最小指标子集代替原来指标个数过多的指标体系合,且这个最小子集一样得出同样精度的结果。

(二)建立信息系统

本文以2008年国内13家石油企业的可持续发展评价数据作为实验数据,其中评价指标集I={x1,x2,∧,X57}共57个指标。指标体系的目标层是“油田企业可持续发展力评价指标体系”。准则层有五个方面:资产与财务、资源禀赋、社会贡献、环境友好、管理与科技。

资产与财务下辖指标有:资产总额、负债总额、资产负债率、主营业务收入、利润总额、工业总产值、工业增加值、完成投资、油气勘探直接投资、油气开发直接投资。资源禀赋下辖指标有:已发现油田个数、已投入开发油田个数、已发现气田个数、采油井、总和汽油比、地质储量采油速度、地质储量采出程度、剩余可采储量采油速度、石油剩余经济可采储量、天然气剩余经济可采储量、采油井。社会贡献下辖指标有:原油商品率、原油统一商品率、天然气商品率、原油产量、天然气产量、原油生产能力、天然气生产能力、年末平均原油日产、平均单井井口日产原油量。环境友好下辖指标有:油井利用率、气井利用率、注水井综合利用率、原油自用率、原油损耗率、外运原油含水率、天然气自用率、天然气生产自用率、天然气损耗率、综合含水率、注水井、年末日注水平、平均单井日注。管理与科技下辖指标有:二维地震、三维地震、钻井进尺钻井完成井口数、获经济工业气流探井口数、油气单位生产成本、二维地震单位成本、三维地震单位成本、探井单位成本、开发井单位成本、老井综合递减率、老井自然递减率。

主成分分析法的原理是在信息贡献最大化的情况下,对提取的各主成分进行加权来构造综合主成分函数,将对象指标的属性值代入函数即可得到各对象的综合评价值。利用综合评价值按照一定标准将其离散化后,自然也对信息系统形成一种划分。粗集理论的核心概念之一是等价类,通过等价关系对论域形成一种划分。由于主成分分析与粗集理论都能对论域形成划分,这样就为两种方法的融合提供了可能,将主成分分析引入粗集理论,使得将信息表扩展成一个决策表成为可能。在此IL(Y)表示经主成分分析评价后确认的企业可持续发展力各子系统的状态。

以资产和财务系统为例,由于原始数据各指标间量纲不一致,因此选用Z-score法对原始数据进行标准化处理,得到标准化数据。

然后利用SPSS13.0软件进行求解,计算各企业的资产和财务子系统综合得分来构造决策属性。通过计算可以得到2个大于1的特征根:λ1=8.737,λ2=1.030。2个主成分的累计贡献率达到97.67%。

再进一步算出两个主成分的得分值y1与y2,计算过程详见参考文献。

最后得到IL(资产与财务系统)综合得分值为Y=σ1y1+σ2y2。其中,σ1=λ1/(λ1+λ2)=0.894493,σ2=0.105507,Y=0.894493y1+0.105507y2。

(三)属性离散化及属性约简

由于计算得到的数据都是连续型的,粗集理决策表中的数据必须是离散型的,因此需要对连续数据进行离散化处理。离散化的方法很多,考虑可持续发展力评价的实际特点,我们用专家评价法对数据离散化,可得最终决策表,如表2所示。

得到信息决策表后,利用波兰Warsaw大学开发研制的Rosetta软件,应用Johnson算法对离散化后的数据进行属性约简,获得1个元素数为2的属性最少的约简,即:CORE(资产与财务)={x1,x3)={资产总额,资产负债率}。同理可以得到石油企业可持续发展力评价的其他信息子系统约简核,CORE(资源禀赋)={已发现气田个数,地质储量采出程度、剩余可采储量采油速度};CORE(社会贡献)={原油商品率,天然气生产能力);CORE(环境保护)={油井利用率,气井利用率};CORE(管理与科技)={二维地震成本,老井综合递减率},由此得到石油企业可持续发展力评价的优化后指标集合Is(如下图所示)。

三、结语

通过以上的分析,我们将主成分分析与粗糙集理论相结合,对石油企业可持续发展力评价指标体系进行了实证分析,优化了该指标集合。剔除信息冗余和对分类不起作用的指标,使指标体系由原来的57个指标约简为11个指标。在保持了指标体系分类能力不变的同时,指标数量减少了80%,从而减少了后期统计与评价的工作量,为石油企业可持续发展力评价指标体系的优化提供一种新的选择。

上一篇:基于SEM的酒店员工满意度及其后续行为研究 下一篇:基于全球价值链的我国本土生产型外贸企业升级...