小议粗糙集在农机故障的价值

时间:2022-06-02 09:17:58

小议粗糙集在农机故障的价值

粗糙集(RoughSet,也称Rough集或粗集)理论是波兰数学家Z.Pawlak于1982年提出的一种能够定量分析处理不精确、不一致、不完整信息与知识的数学工具[3]。该理论已被证明特别适合于数据简化、数据相关性以及相似性的查找,发现数据模式,并从数据中提取推理规则等无需提供除问题所需处理的数据集以外的任何先验信息[4-5]。事实上,正是因为处理数据前无需任何先验信息的机制,所以经粗糙集理论处理过的数据信息能够较为客观地反映所描述的问题。随着农业机械系统复杂性的不断提高,机械系统故障也呈现出多样性和隐蔽性,加之在故障产生机理上研究的滞后,使得在故障信息采集时不得不盲目进行,其直接后果就是大量不完备的信息导致机械系统故障无法及时、有效地诊断,而解决这种问题正是粗糙集理论的优势所在。本文将从粗糙集理论的属性约简和规则获取两个方面在农业机械故障诊断中的应用进行研究,以期丰富农业机械故障诊断方法。

1粗糙集理论的基本概念

定义1设U≠是感兴趣的对象组成的有限集合,称为论域[6]。包含于论域U的任意子集X称为U中的一个概念或范畴,U中任何概念族称为关于U的知识,空集也认为是一个概念[7]。

2基于粗糙集理论的机械故障诊断方法

目前,机械故障诊断方法较多,但是由于机械故障诊断过程复杂的非线性特性,致使描述故障的信息往往具有一定的不完备和不确定性[8]。所以,在诸多的诊断方法中只有基于知识的诊断方法才具有较强的实际意义。而粗糙集理论却可以在保证分类能力不变的前提下对不完备和不确定信息进行处理解,这也致使粗糙集理论应用于机械故障诊断称为必然。所以,基于粗糙集理论进行故障诊断是该领域的研究热点,其基本步骤大致可归纳如下[9]:步骤1:由于原始故障数据获得途径的多样性,往往会导致无效信息或信息缺失,所以对信息系统中的原始数据进行预处理尤为重要。这里包括遗漏信息的补齐和无效信息的删除。此外,由于运用粗糙集理论处理决策表时处理对象只能是离散数据,而不能直接处理连续属性,所以一般情形下还应对包含连续属性的故障决策表进行属性离散化处理。步骤2:对信息系统进行约简,即删除冗余属性。此过程中,属性约简和属性值约简是粗糙集理论最为重要的两个内容,也是粗糙集理论应用于知识处理的主要方法。属性约简的目的在于:保证机械故障分类能力不变的同时,去掉导致故障的不必要或次要原因属性,保留导致故障结果的主要原因属性。粗糙集理论中的约简过程主要是在保证约简前后不可区分关系不变的前提条件下进行的。该过程最终要获得的是与初始属性集具有相同分类能力的最小约简属性子集。删除算法是对信息系统进行属性约简使用最多的方法,如果一信息表删除某些属性后形成的新信息表与原信息表不可区分关系相同,那么删除的那些属性对于原信息表而言就是冗余的。在此基础上形成的具体删除算法如下:1)删除决策表中的某一属性列。2)删除重复的行,即删除重复的实例。3)若决策表不可区分关系未发生改变,则删除该条属性;若决策表中不可区分关系发生改变,则保留该条属性。通过以上属性约简过程可以大大减少故障诊断信息提取的时间和工作量,从而保证诊断的时效性。步骤3:经属性约简后的信息表中,每条记录的所有条件属性值对于决策规则的获得并非都是必要的,所以需要对属性约简后的决策表进行属性值约简。具体做法是:对决策表中的每条记录进行分析,进而删除对机械故障分类不起决定作用的冗余条件属性值。这样,经过决策规则的化简,使得决策表中每个样本都代表一类故障诊断决策规则。

3应用实例

下面使用粗糙集理论对某型农业机械设备的故障进行诊断分析。该农业机械故障原始数据如表1所示。将机械系统故障信息形成决策表,其中行为故障实例列为故障属性(包括故障原因属性和故障结果属性)。事实上,只需对表1进行简单的替换,即可得到如表2所给出的机械系统指标与故障间的离散数据决策表,故此处无需离散化。在表2中,数值0表示指标值正常,数值1表示指标值过低或报警,数值2表示指标值过高;d1表示进料口堵塞,d2表示传送机故障,d3表示脱粒机故障,d4表示烘干机故障,d5表示封装机故障。对表2采用前面介绍的删除算法进行约简:首先,进行条件属性约简,以去除对于故障结果不必要的信息。删除属性a1,即在原决策表(表2)中消去第1列后易见新决策表与原决策表的不可区分关系相同,也就是说可由除a1以外的其余条件属性来唯一地确定决策属性d(故障)。类似地,删除条件属性a2以及a3后得到的决策表与原决策表不可区分关系仍相同,即说明条件属性{a1,a2,a3}是不必要的,可以删除,于是得属性约简集{a4,a5,a6},约简后的决策表如表3所示。其次,删除决策表中重复的行。显然,本例中无完全相同的两行。最后,通过计算决策规则中条件属性的核值删除每一条决策规则中的冗余属性。表3中的第1行a40a51a60d1与a51a60d1保持一致,而a40a51d1与第2行a40a51d2矛盾,a40a60d1与表中第3行a40a51d3矛盾。所以,属性值(a4,0)可以约去,但(a5,1),(a6,0)不能被约去,为第1条规则的核值。第2行a40a51a61d2与a51a61d2保持一致,而a40a51d2与第1行a40a51d1矛盾,a40a61d2与第3行a40a61d3矛盾。所以,属性值(a4,0)可以约去,但(a5,1),(a6,1)不能被约去,为第2条规则的核值。其余依次类推可得仅包含决策规则的核值表,如表4所示。根据故障诊断决策规则核值表,可以求出每一条决策规则的约简,最后一列即决策属性d(机械故障)各不相同,因此由表4可以得到应用于实际的故障诊断规则。规则1:若(指标5过低)且(指标6正常),则(进料口堵塞);规则2:若(指标5过低)且(指标6过低),则(传送机故障);规则3:若(指标5过高),则(脱粒机故障);规则4:若(指标4过低),则(烘干机故障);规则5:若(指标4过高),则(封装机故障)。这些规则相对于原始数据更加简洁明了,对决策者而言更有意义。使用粗糙集的方法对原始数据处理后,原本用6个条件属性(指标)才能完成的常见故障诊断,现在仅用其中的3个条件属性即达到同样的诊断效果,属性约简率高达50%。由此可见,通过使用粗糙集理论对某型农业机械故障信息系统进行属性和属性值约简后,获得的故障诊断规则与原决策表分类质量完全一致。但值得注意的是,约简后只需通过3个属性中的一部分属性值即可得到相同的故障诊断结果。这种处理一方面降低了机械系统故障指标采集的成本,另一方面通过降低信息表达空间维数加速了整个机械系统的推理速度,从而使故障诊断的时效性大大提高。

4结语

本文通过粗糙集理论在某型农业机械故障诊断中的应用实践,证明了该理论应用于农业机械故障诊断规则的获取是一种行之有效的方法。当然,粗糙集理论还可以用于动态环境下故障诊断的规则获取等其它方面[10]。尽管农业机械故障诊断技术中引人粗糙集理论的研究还不很成熟,但随着粗糙集理论研究的不断深入,它将会在今后农业机械故障诊断方法的研究与实践中发挥越来越重要的作用。

作者:杨雨时张丽娜周静单位:河北农业大学理学院

上一篇:概率统计的课程内容与特点 下一篇:AHP-Fuzzy农机项目发展排序模型与运用