一种新的基于粗糙集的决策树算法

时间:2022-06-20 06:38:25

一种新的基于粗糙集的决策树算法

摘 要:基于粗糙集的决策树方法应用非常广泛,但是在教育领域的应用仍然不多,将数据挖掘中的决策树技术与粗糙集理论进行了有机的结合,提出了一种基于粗糙集技术的决策树算法,该算法通过计算属性相对于划分的重要度作为选择扩展属性根结点的标准,并递归地生成决策树。经验证该算法是有效的。

关键词:数据挖掘;粗糙集;决策树;有效

中图分类号:TP391 文献标识号:A

引言

高校学生评教是高校内部教学质量监控的重要组成部分,对于促进教学改革和提高教学质量起到一定的作用。然而,现行高校学生评教大多是学校教务部门将评教结果以百分制或评教等级的形式反馈给教师,教师无法从反馈结果知道自己需要在哪些方面进行改进。学校教务部门也无法从大量的评教数据中发现隐藏的知识。

1算法提出

试着将粗糙集和决策树技术两者结合起来,对学生的评教数据进行分析。试图从评教数据中发现教师本身的素质和每项评教指标与评教结果之间的关系,从而提供一些潜在的、有价值的决策信息供高校人事部门和科研部门参考,并为教师招聘及教师培养提供依据。

2基于粗糙集的决策树算法描述

}

3算法验证

此算法主要是通过计算属性相对于划分的重要度来构建决策树表,以打网球的训练样本集为例,验证该算法的有效性。

假设在训练的样本集中加入一个日期属性,并假设日期属性值都不一样用它来分割样本集,得到14个样例子集,而每个样例子集只包含一个样例,算法终止。最终得到的决策树是一棵一个根结点、14个分支和叶结点的一层决策树。ID3算法对这样的样本集失效。接下来我们用上面提出的基于粗糙集的决策树算法构造决策树。构造步骤如下:

由于U11和U12这两个子集中的对象属于同一个类,所以该算法结束。对U3={D4,D5,D6,D10,D14}重复上述过程,最终生成的决策树如图1所示。

图1 打网球决策树

从最终生成的决策树可以看出,生成的决策树与用经典ID3算法生成的决策树完全相同,但是它可以克服ID3偏向选择属性取值较多的属性作为决策树的根节点,即可以克服ID3算法的某些不足。

4小结

将数据挖掘中的决策树技术与粗糙集理论进行了有机的结合,提出了一种基于粗糙集技术的决策树算法。该算法通过计算属性相对于划分的重要度作为选择扩展属性根结点的标准,并递归地生成决策树。经验证是有效的。

参考文献

[1]胡来丰,舒兰.基于粗集理论的决策树在信用卡发放中的应用[J].计算机技术与发展,2015,(3):142-145.

[2]朱付保,霍晓齐,徐显景等.基于粗糙集的ID3决策树算法改进[J].郑州轻工业学院学报(自然科学版),2015,(1):50-54.

[3]傅莉.数据挖掘在教学评估中的应用[D].南京:南京理工大学,2007年.

上一篇:土地测绘技术在土地开发整理中应用探讨 下一篇:桥式起重机主梁惯性分析