α―最大相容水平SF决策信息系统的知识约简

时间:2022-09-27 06:20:51

α―最大相容水平SF决策信息系统的知识约简

摘 要 引入了SF决策信息系统中的最大相容水平概念,研究了α-最大相容水平ε-不协调SF决策信息系统,建立了它的粗糙集模型,讨论了它的α-水平分布ε-约简.

关键词 SF决策信息系统;α-最大相容水平;ε-不协调;α-水平分布ε-约简

中图分类号 TP18 文献标识码 A 文章编号 1000-2537(2015)03-0063-06

粗糙集理论[1]由著名科学家Pawlak在1982年提出,它是处理信息系统的有力工具,在医疗诊断、数据挖掘、模式识别以及知识发现[2]等方面应用广泛.

集值信息系统作为一种重要的信息系统,近年来得到了深入研究.王虹等[3]与宋笑雪等[4]研究了基于相容关系的集值信息系统.但相容类有一些不足,管延勇等[5]为此引入了最大相容类的概念,弥补了一般相容类所存在的不足.此外,最大相容类的思想也被陈子春等[6]、陈秀等[7]应用于各自提出的变精度相容关系下的集值信息系统.这些成果说明通过最大相容类来研究集值信息系统的约简问题是可行的.

模糊决策信息系统是模糊环境下的决策信息系统.关于决策信息系统和模糊决策信息系统的研究,目前已有不少成果产生,如Zhou等[8]绘出了决策信息的相对约简的快速算法;Luo等[9]研究了集值序决策信息系统中近似的动态保持;Zhang等[10]则研究了区间值决策信息系统中多信规则的获取和信赖保持属性约简;如管涛等[11]提出了基于模糊决策信息系统的粗糙分布约简等若干类约简,刻画了其相关性质与约简判定定理;余承依[12]等研究了不协调决策信息系统最大分布约简新方法;黄兵等[13]研究了模糊决策信息系统的变精度粗糙集模型;杨习贝等[14]通过建立一种基于参数分类的自反关系,将集值信息系统引入模糊环境中讨论.喻光继[15]研究了区间值模糊决策信息系统的属性约简.

集值模糊决策信息系统(简称SF决策信息系统)则是模糊环境下的集值决策信息系统,α-最大相容水平SF决策信息系统是它的推广.本文深入研究了α-最大相容水平SF决策信息系统的知识约简,从而以上提到的SF决策信息系统的知识约简是它的特款.

1 基本概念

在本文中,集值模糊决策的信息系统简称SF决策信息系统,U表示称为论域的非空集.2U表示U的幂集,I表示闭区[0,1],BA表示所有由集A到集B的映射构成的集.为了方便,约定

U={x1,x2,…,xn},A={a1,a2,…,am},D={d1,d2,…,dp},ε∈[0,1].

定义1.1[2] 称(U,A,F,D,G)为决策信息系统,其中U为对象集;A为条件属性集;F={fa∈VUa:a∈A}为U与A的关系集,fa称为a的信息函数,Va为a值域;D称为决策属性集;G={gd∈VUd:d∈D}为U与D的关系集,gd称为d的信息函数,Vd为d的值域.

定义1.2[9] 称(U,A,F,D,G)为SF决策信息系统,其中(U,A,F)为集值信息系统,即U为对象集,A为条件属性集,F={fa∈(2Va-{})U:a∈A}为U与A的关系集,fa称为a的信息函数,Va为a的值域;D称为决策属性集;G={gd∈IU:d∈D}为U与D的关系集,U上的模糊集gd称为d的信息函数.

定义1.3[2] 设(U,A,F,D,G)为SF决策信息系统.令

RA={(xi,xj):fal(xi)=fal(xj)(l≤m)},

RD={(xi,xj):gdk(xi)=gdk(xj)(k≤p)}.

若RARD,则称(U,A,F,D,G)为协调SF决策信息系统;否则,称(U,A,F,D,G)为不协调SF决策信息系统.

SF决策信息系统中对象关于条件属性的信息函数值未必是单值的,若按等价关系来处理分类问题,会出现划分过细的情况,不便于提取知识.为此考虑相容关系.

定义1.4[5] 设R为U上的相容关系.

(1) 称X∈2U为U上的R相容类,若对x,y∈X,有xRy.

(2) 称X∈2U为U上的R最大相容类,若X为U上的R相容类,且对x∈U-X,存在y∈X使(x,y)R.

不同相容类之间可能存在包含关系,不能保证同一相容类中的对象之间两两相容.针对这些不足,可考虑最大相容类.最大相容类之间不存在包含关系,只可能有相交关系,这样保证了同一类中的元素的“共性”没有被丢失.

让U上的所有R最大相容类构成的集为CCR(U).对x∈U,记

CCR(x)={K∈CCR(U):x∈K},

它表示U上的所有包含x的R最大相容类构成的集.

定义1.5[3-4] 设(U,A,F,D,G)为SF决策信息系统,对BA,定义U上的关于B的相容关系TB如下:

TB={(x,y)∈U×U:fb(x)∩fb(y)≠(b∈B)}.

对x,y∈U,若xTBy,则称x,y关于B是相容的.记TB(x)={y∈U:xTBy}.

对b∈B,x∈U,简记

Tb=T{b},Tb(x)=T{b}(x);

CCTb(U)=CCT{b}(U),CCTb(x)=CCT{b}(x).

易验证TB=∩b∈BTb,TB(x)=∩b∈BTb(x).

定义1.6[10] 设(U,A,F,D,G)为SF决策信息系统,对xi,xj∈U,定义

SD(xi,xj)=∧{1-|fd(xi)-fd(xj)|:d∈D},

其中fd(xi)表示xi关于决策属性d的信息函数值:

SεD={(xi,xj)∈U×U:SD(xi,xj)≥ε},

其中ε称为(U,A,F,D,G)的决策容差.

注1.1 SεD为相容关系.特别地,S1D={(xi,xj)∈U×U:fd(xi)=fd(xj)(d∈D)}为U上的等价关系.记

[xi]εD={xj∈U:(xi,xj)∈SεD},Dε=U/SεD={[xi]εD:xi∈U}.

它们分别表示xi关于SεD的相容类和U的模糊决策分类.

2 最大相容水平与ε-不协调SF决策信息系统

在SF决策信息系统中引入最大相容水平概念,以此定义一种具有变精度的相容关系.

定义2.1[10] 设(U,A,F,D,G)为SF决策信息系统.对xi,xj∈U,b∈BA,α∈[0,1],记

Γb(xi,xj)=|CCTb(xi)∩CCTb(xj)||CCTb(xi)∪CCTb(xj)|.

其中|・|表示集的基数,CCTb(xi)∩CCTb(xj)={S∈2U:S∈CCTb(xi)且S∈CCTb(xj)},CCTb(xi)∪CCTb(xj)={S∈2U:S∈CCTb(xi)或S∈CCTb(xj)}.记

TαB={(xi,xj)∈U×U:Γb(xi,xj)≥α(b∈B)}.

与xi,xj∈U的最大相容类相关的二元函数Γb(xi,xj)依赖α的值,则称α为(U,A,F,D,G)的最大相容水平,称(U,A,F,D,G)为α-最大相容水平SF决策信息系统.

易验证,TαB为相容关系.对b∈B,记Tαb=Tα{b}.

TαB(x)={y∈U:(x,y)∈TαB},它表示x关于TαB的相容类.记TαB(U)={TαB(x):x∈U},它表示U上所有关于属性集B及最大相容水平α的相容类构成的集.

显示 T1B={(xi,xj)∈U×U:CCTb(xi)=CCTb(xj)(b∈B)}为U上的等价关系.

性质2.1 对x∈U,CBA与α∈[0,1],有

(1)TαATαBTαC,TαA(x)TαB(x)TαC(x);

(2)TαB=∩b∈BTαb.

证 显然.

定义2.2 设(U,A,F,D,G)为α-最大相容水平SF决策信息系统,ε为它的决策容差.若TαASεD,则称(U,A,F,D,G)为α-最大相容水平ε-协调SF决策信息系统;否则,称(U,A,F,D,G)为α-最大相容水平ε-不协调SF决策信息系统.

显然,不协调SF决策信息系统是1-最大相容水平1-不协调SF决策信息系统的特例,协调SF决策信息系统则是1-最大相容水平1-协调SF决策信息系统的特例.

例2.1 在表1所示SF决策信息系统(U,A,F,D,G)中,A={a1,a2,a3},D={d1,d2,d3}.显然T0.4AS0.4D,T0.4AS0.7D.可见,(U,A,F,D,G)不仅为0.4-最大相容水平0.4-协调SF决策信息系统,同时为0.4-最大相容水平0.7-不协调SF决策信息系统.

3 知识约简

定义3.1 设(U,A,F,D,G)为α-最大相容水平SF决策信息系统.对BA,X∈2U,定义

CCTαB(X)={x∈U:TαB(x)X},CCTαB(X)={x∈U:TαB(x)∩X≠},

则CCTαB(X)和CCTαB(X)分别称为X的α-水平下近似和α-水平上近似.

性质3.1 设(U,A,F,D,G)为α-最大相容水平SF决策信息系统,CBA,X∈2U.则CCTαC(X)CCTαB(X)XCCTαB(X)CCTαC(X).

证 由性质3.1可证.

定义3.2 由(U,A,F,D,G)为α-最大相容水平ε-不协调SF决策信息系统,BA,U的模糊决策分类为Dε={Dεi:i≤r}.对α∈[0,1],定义

LB(α,ε)=(CCTαB(Dε1),CCTαB(Dε2),…,CCTαB(Dεr)),

HB(α,ε)=(CCTαB(Dε1),CCTαB(Dε2),…,CCTαB(Dεr)),

它们分别称为α水平下分布函数和α-水平上分布函数.

(1)若LB(α,ε)=LA(α,ε),则称B为α水平下ε-分布协调集;若还满足对B′B,有LB′(α,ε)≠LA(α,ε),则称B为α-水平下分布ε-约简.

(2)若HB(α,ε)=HA(α,ε),则称B为α水平上ε-分布协调集;若还满足对B′B,有HB′(α,ε)≠HA(α,ε),则称B为α-水平上分布ε-约简.

对x∈U,α∈[0,1],记

(GαB)ε(x)={Dε∈Dε:TαB(x)Dε},(MαB)ε(x)={Dε∈Dε:TαB(x)∩Dε≠}.

命题3.1 设(U,A,F,D,G)为α-最大相容水平ε-不协调SF决策信息系统,U的模糊决策分类为Dε.

(1)对Dε∈Dε,CCTαB(Dε)={x∈U:Dε∈(GαB)ε(x)}.

(2)对Dε∈Dε,CCTαB(Dε)={x∈U:Dε∈(MαB)ε(x)}.

(3)若CBA,则对x∈U,(GαC)ε(x)(GαB)ε(x),(MαC)ε(x)(MαB)ε(x).

证 显然.

定理3.1 设(U,A,F,D,G)为α-最大相容水平ε-不协调SF决策信息系统,BA,则下列条件等价:

(1)B为α-水平下分布ε-协调集当且仅当对x∈U,有(GαB)ε(x)=(GαA)ε(x).

(2)B为α-水平上分布ε-协调集当且仅当对x∈U,有(MαB)ε(x)=(MαA)ε(x).

证 (1)对U的模糊决策分类Dε,

(GαB)ε(x)Dεx∈CCTαB(Dε)Dε∈(GαB)ε(x),

故B为α-水平下分布ε-协调集当且仅当

(GαB)ε(x)Dε(GαA)ε(x)Dε(x∈U,Dε∈Dε),

当且仅当(GαB)ε(x)=(GαA)ε(x)(x∈U).

(2)类似(1)可证.

定义3.3 设(U,A,F,D,G)为α-最大相容水平ε-不协调SF决策信息系统,BA,U的模糊决策分类为Dε.对xi,xj∈U,记

Pαε={(xi,xj)∈U×U:Dε∈Dε,xi∈CCTαA(Dε),xjDε},

Pαε={(xi,xj)∈U×U:Dε∈Dε,xiCCTαA(Dε),xj∈Dε}.

定义

Wαε(xi,xj)={a∈A:(xi,xj)Tαa},(xi,xj)∈Pαε

,(xi,xj)Pαε

Wαε(xi,xj)={a∈A:(xi,xj)Tαa},(xi,xj)∈Pαε,

,(xi,xj)Pαε.

Wαε(xi,xj)与Wαε(xi,xj)分别称为xi与xj的α-水平下分布ε-可辨识属性集与α-水平上分布ε-可辨识属性集.定义

Wαε=(Wαε(xi,xj):(xi,xj)∈U×U)n×n,Wαε=(Wαε(xi,xj):(xi,xj)∈U×U)n×n.

Wαε与Wαε分别称为(U,A,F,D,G)的α-水平下分布ε-可辨识属性矩阵与α水平上分布ε-可辨识属性矩阵.

定理3.2 设(U,A,F,D,G)为α-最大相容水平ε-不协调SF决策信息系统,BA,则对xi,xj∈U,有:

(1)B为α-水平下ε-分布协调集当Wαε(xi,xj)≠时,有B∩Wαε(xi,xj)≠;

(2)B为α-水平上分布ε-协调集当Wαε(xi,xj)≠时,有B∩Wαε(xi,xj)≠.

证 (1)必要性.倘若存在(xi,xj)∈Pαε使B∩Wαε(xi,xj)=和Wαε(xi,xj)≠.由B为α-水平下分布-ε协调集,Dε∈Dε,则BA-Wαε(xi,xj).这说明(xi,xj)∈TαB,即xj∈TαB(xi).

另一方面,注意到(xi,xj)∈Pαε.故a) xi∈CCTαA(Dε); b) xjDε.

由B为α-水平下分布ε-协调集知,CCTαB(Dε)=CCTαA(Dε)(Dε∈Dε).结合a),有xi∈CCTαB(Dε),即TαB(xi)Dε.而xj∈TαB(xi),故xj∈Dε,这与b)矛盾.

充分性.倘若B不是α-水平下ε-分布协调集,即LB(α,ε)≠LA(α,ε),则存在Dε0∈Dε使CCTαB(Dε0)≠CCTαA(Dε0).由BA,CCTαB(Dε0)CCTαA(Dε0).任取x∈CCTαA(Dε0)-CCTαB(Dε0),有TαB(xi)Dε0,即TαB(xi)-Dε0≠.这说明存在xj∈U-Dε0使xj∈TαB(xi),从而(xi,xj)∈TαB=∩b∈BTαB,即(xi,xj)∈TαB(b∈B).但(xi,xj)∈Pαε.故B∩Wαε(xi,xj)=,这与题设矛盾.从而B为α-水平下分布ε-协调集.

定义3.4 设(U,A,F,D,G)为α-最大相容水平ε-不协调SF决策信息系统,BA,U的模糊决策分类为Dε,Wαε(xi,xj)与Wαε(xi,xj)分别为xi与xj关于Dε的α-水平下分布ε-区分辨识属性集与α水平上分布ε-区分辨识属性集,其中α∈[0,1].记

αε=∧{∨Wαε(xi,xj):(xi,xj)∈Pαε}, αε=∧{∨Wαε(xi,xj):(xi,xj)∈Pαε},

它们分别称为(U,A,F,D,G)的α-水平下、上分布ε-区分辨识函数.

定理3.3 设(U,A,F,D,G)为α-最大相容水平ε-不协调SF决策信息系统,其α-水平下、上分布ε-区分辨识函数的极小析取范式分别为

αε=∧tm=1(∨q(1)mn=1a(1)ln),

αε=∧tm=1(∨q(2)mn=1a(2)ln).

B(i)km={a(i)ln:n=1,2,…,q(i)m}(i=1,2).

则对m≤t,B(1)km与B(2)km分别是α-水平下、上分布ε-约简.

证 利用布尔推理定理可证.

例3.1 考虑例2.1中的0.4-最大相容水平0.7-不协调SF决策信息系统(U,A,F,D,G).它的0.4-水平下分布0.7-区分辨识属性矩阵为:

(W0.40.7)=

{a2}{a3}{a3}{a2,a3}

{a1,a3}{a2,a3}

{a2}{a1,a3}{a2}{a1,a2}{a1,a3}{a2}{a3}

{a2}C{a3}

{a3}{a1,a2}C{a2,a3}{a2}{a2}

{a1,a3}{a2,a3}{a2,a3}

{a3}{a2,a3}{a2}{a3}{a2}{a2,a3}

{a2,a3}{a3}{a2}

它的0.4-水平下分布0.7-区分函数:

0.40.7=a2∧a3∧(a2∨a3)∧(a1∨a3)∧(a1∨a2)∧(a1∨a2∨a3)=a2∧a3.

因此B={a2,a3}为它的0.4水平下分布0.7-约简.

4 结语

本文介绍了最大相容水平概念,基于它定义了变精度相容关系,给出了α-最大相容水平ε-不协调SF决策信息系统.

参考文献:

[1] PAWLAK Z. Rough sets [J]. Int J Comput Inf, 1982,11(5):341-356.

[2] 张文修,梁 怡,吴伟志.信息系统与知识发现[M].北京:科学出版社, 2003.

[3] 王 虹,张文修,李鸿儒.集值信息系统的知识发现与约简[J].计算机工程与应用, 2005,40(6):37-38.

[4] 宋笑雪,解争龙,张文修.集值决策信息系统的知识约简与规则提取[J].计算机科学, 2007,34(4):182-191.

[5] 管延勇,王洪凯,史开泉.集值信息系统及其属性约简[J].数学的实践与认识, 2008,28(2):101-107.

[6] 陈子春,秦春云.集值信息系统基于变精度相容关系的知识约简[J].计算机工程与应用, 2008,44(9):27-29.

[7] 陈 秀,李克典.集值决策信息系统及其知识约简[J].海南师范大学自然科学学报, 2008,21(4):389-392.

[8] ZOU H, ZHANG C. Quick algorithm for relative reduction based on decision information system [J].Procedia Eng, 2011,15(5):1504-1508.

[9] LUO C, LI T, CHEN H. Dynamic maintenance of approximations in set-valued ordered decision systems under the attribute generalization [J]. Inf Sci, 2014,257(4):210-228.

[10] ZHANG X, MEI C, CHEN D, et al. Multi-confidence rule acquisition and confidence-preserved attribute reduction in interval-valued decision systems [J]. Int J Approxim Reasoning, 2014,55(8):1787-1804.

[11] 管 涛,冯博琴.模糊目标信息系统上的知识约简方法[J].软件学报, 2004,15(10):1470-1478.

[12] 余承依,李进金.不协调决策信息系统最大分布约简新方法[J].计算机应用, 2011,31(6):1645-1648.

[13] 黄 兵,周献中,胡作进.模糊目标信息系统的VPRS模型及知识约简[J].系统工程与电子技术, 2007,29(11):1859-1862.

[14] 杨习贝,杨静宇,吴 陈.模糊集值信息系统中的决策规则获取研究[J].系统仿真学报, 2008,20(5):1199-1202.

[15] 喻光继. IVED信息系统的属性约简的一个注记[J].湖南师范大学自然科学学报, 2014,37(4):66-71.

上一篇:密固达预防全髋关节置换术后骨质疏松临床研究 下一篇:四方通信亮剑互联网产业 双轮驱动 全球化战略