浅谈粒度计算模型

时间:2022-09-21 11:17:49

浅谈粒度计算模型

摘 要:近年来,人们开始将粒度计算应用到数据挖掘领域中,并初步取得了一些成果,成为当前数据挖掘领域一个新的研究方向。本文研究了模型中的粒度计算,浅谈了几类粒度计算模型。

关键词:数据挖掘 粒度计算 粒度计算模

一、粒度计算的起源

1979年,美国数学家Zadeh在模糊集合论的基础上,首次提出并讨论了模糊信息粒化问题,推动了模糊逻辑理论及其应用的发展,但当时未引起普遍的重视。1985年,Hobbs提出一种粒度理论 ,在人工智能中将一个表示待求解的整体问题的逻辑公式用粒度理论方法分解成若干个小问题或子公式,然后分别对这些子公式求解并最后合并成整体公式的解。Hobbs在文中提出的这个模型实质上是把较大的整体粒度拆成较小的局部粒度,反过来又从较小的粒度合并成整体粒度解, 但该文只是提出了这个模型的假设,并没有给出粒度计算的规则,只是用谓词或函数项定义了粒度和划分粒度。 T. Y. Lin等人于1997年正式提出粒度计算概念,随后,在短短的几年里,人们在各个不同的角度中广泛研究粒度计算,但更多的还是从模糊集和粗糙集方面入手,目前粒度计算都是和这些学科结合起来,没独立成形。

二、粒度计算模型

1.粒度计算定义

L. A.Zadeh 提出了人类认知的三个基本概念:粒化(granulation)、组织(organization)和因果(causation)。粒化指将整体分解为部分,组织指从部分合并为整体,因果指原因和结果的关联。他进一步指出粒度计算是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究。粗略地讲,一方面它是模糊信息粒度理论、粗糙集理论、商空间理论、区间计算等的超集,另一方面是粒度数学的子集。具体地讲,凡是在分析问题和求解问题中应用了分组、分类和聚类手段的一切理论与方法均属于粒度计算的范畴。

2.粒度计算的基本问题

粒度计算主要涉及两个方面的问题:粒的构造和利用粒作为对象的运算、推理。对于其中的每个问题都可以从语义和算法两个方面来进行研究 。

粒的构造涉及粒的形成、表示。在集合理论中,一个粒可以被理解为一个子集,在词计算理论中,将语句作为一个模糊粒。

一个粒的构造可以采用自顶向下(top-down)的分解形成,也可以自底向上(button-up)的合成。分解或合成到什么地步以达到所需的粒度,一般来说是基于相互之间的关系来确定是不是应该合成或分解,有时也会借助于语义或领域知识的帮助。

具体说来,粒的构造包含以下三个方面的内容:

(1)构造粒的标准、准则。准则是用来确定、规定为什么不同的对象需要放到同一粒中,准则必须信息粒化的结果对问题的本质有更深入的理解。

(2)构造粒的方法。构造粒或者信息粒化的方法是从算法角度来考虑,也就是回答如何将不同的对象放到同一个粒中。

(3)粒的表示及描述。一旦粒化结束,也即粒已经构造好了,必须使用某种语言去描述它。可以给不同层次的粒度标上标记,也可以用数学公式形式化地描述它,也可以用粒中的中心点来表示,或者可以通过描述不同粒度的范围来区分不同的粒度。

(4)定性、定量分析。通过对粒的定性、定量分析,可以提取必要的规则。

3.粒度计算模型

目前有关粒度计算的理论与方法,主要有三个。一是Zadeh的“词计算理论”(Theory of Works Computing),二是Z.Pawlak 的“粗糙集理论”(Theory of Rough Set),三是国内的张钹院士和张铃教授提出的“商空间理论”(Theory of Quotient Space)。

(1)词计算理论

Zadeh认为人类在进行思考、判断、推理时主要是用语言进行的,而语言是一个很粗的“粒度”,如我们说“九寨沟的风景很美”,其中州良美”这个词就比较“笼统”,也就是说其粒度很粗,如何利用语言进行推理判断,这就是要进行“词计算”,早在二十世纪六十年代Zadeh提出模糊集理论,就是“词计算”的雏型。沿Zadeh的模糊集论的方向,用模糊数学的方法进行有关粒度计算的方法和理论的研究,就构成“粒度计算”的一个非常重要的方法和方向。这也是人们比较熟悉的一个方法。

(2)粗糙集理论

知识的含糊性包括:①语言的模糊性,如大小、多少;②数据的不完整性,如噪声、干扰;③知识本身的粗糙性,如规则的前后间的依赖关系不确定性等。

波兰学者Z.Pawlak在1982年首先提出了粗糙集理论,它不仅能够在缺少关于数据的先验知识的情况下,仅仅以观测数据的分类能力为基础,解决模糊或不确定性数据的分析和处理,而且算法简单,易于理解。粗糙集理论把知识看成是对有关对象论域的划分,而等价关系 和由其产生的等价类则是关于 的有效信息东或知识。

分类和概念形成的实际需要促进了 理论的发展,目前粗糙集模型已成功应用于智能研究领域的方方面面,表现出巨大的实用价值和通用性、。为了本文以后的研究需要,本节叙述一些有关粗糙集的基本概念与记号。

(3)基于商空间的粒度计算

粒度概念可以用子集来表示,不同粒度的概念就体现为不同粒度的子集,一簇概念就构成空间的一个划分―商空间(知识基),不同的概念簇就构成不同的商空间。故粒度计算,就是研究在给定知识基础上的各种子集合之间的关系和转换。以及对同一问题,取不同的适当的粒度,从对不同的粒度的研究中,综合获取对原问题的了解。这种对粒度的理解与模糊集对粒度的理解不完全一样。

总结

本文主要介绍了粗糙集理论和粒度计算模型的基本理论和相关概念。粒度计算是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究,现己成为人工智能领域研究的热点之一。主要讨论了粒度计算的基本问题,三种不同模型。

参考文献

[1] Hobbs,J.R.Granularity. In:Proc of IJCAI[Z],Los Angeles,1985:432-435.

[2] Zadeh, L.A.Fuzzy logic=computing with words[J],TEEE Transaction on fuzzy Systems, 1996,2:103-111.

[3] Zadeh, L.A.Towards a theory of fuzzy information granulation and its centrality in human reasoning and fuzzy logic[J],Fuzzy Sets and Systems,1997,(19):111-127.

[4]粒度计算方法,赵立权,计算机工程与应用,2006(35):1-1.

[5]粒度计算与图像匹配技术改进,汪建,电脑知识与技术,2013(33):50-53.

上一篇:新课改下的初中历史教学方法浅析 下一篇:小学低年级学生数学学习兴趣的培养