基于决策树的主观题自动批改方法研究

时间:2022-05-25 06:19:55

基于决策树的主观题自动批改方法研究

摘 要:网络学习中客观题基本实现了自动批改,但主观题自动批改仍有待研究。本文利用数据挖掘中的机器学习方法,提出一种基于决策树主观题自动批改方法。该方法从教师给出的标准答案中自动发现批改规则,依据这些规则自动批改学生的作业。文中给出了实验的结果,该结果显示了决策树方法的有效性。

关键词:主观题 自动批改 决策树

中图分类号:TP751 文献标识码:A 文章编号:1672-3791(2012)12(a)-0207-02

网络学习作为一种新的教学形式,受到越来越多的关注。与传统课堂教学相比,现代网络学习有一定的优势,主要体现在:网络学习不受时间、地点的限制,学生可以自由安排学习的时间和地点;网络学习是一种整体式教学、个性化学习的教学模式,学生可以根据自己的需求自主选择学习的内容和方式,自由调节学习进度;网络学习可以利用庞大的教学信息资源,通过电子邮件、论坛等多种形式实现师生间的互动,为学生提供有效的知识体系[1];网络教学具有信息容量大、资料更新快和多向演示、模拟生动的显著特征,这一点是有限空间、有限时间的传统教学方式所无法比拟的。

随着计算机虚拟现实技术、仿真技术、数据挖掘技术、人工智能等技术的不断发展,传统课堂教学在作业批改、实时反馈、情感交流渗透等方面独有的优势,将逐渐被网络教学系统引入和完善。

作业批改是保证学生掌握知识和改进教学的重要环节。作业题主要有两大类:一类是客观题,答案比较明确。评分通常采用精确匹配方法,答案相同则得分,否则不得分;另一类主观题,答案没有唯一标准。一般是叙述方式答题,个人对知识的理解程度不同,表述也不一致[2]。利用计算机技术实现自动批改,不仅可以节省大量手工批改工作,能及时反馈评分结果,而且避免了批改过程的人为因素[3]。目前客观题的自动批改基本日趋成熟,被广泛应用到各类大规模的考试中。而主观题的批改由于涉及人工智能、模式识别和自然语言理解等领域的知识,主观题的自动批改已成为亟待解决的问题[4]。

21世纪以来,主观题自动批改的研究得到了一些发展。刘建舟等提出了一种利用中文信息处理中的句子相似度的主观题自动批改方法[5];李佳林通过分析主观题人工评分的思维习惯,提出了关键字匹配和关键字贴近度匹配相结合的主观题自动评分方法[6];潘国清提出了文本语义形式化的表示方法,即语片表示法,实现了主观题的自动判分系统[7]。

已开发的主观题自动批改系统,主要采用学生作业与标准答案匹配的模式进行评分,对标准答案要求具有严格、详细的格式,增加了出题的难度;有些系统只能处理具有特定句型的答案,当学生的答案不属于规定句型,系统不能进行正确批改。

针对主观题自动批改目前存在的问题,本文运用决策树方法,探讨自动评定主观题等级的方法。该方法对于完善网络教学模式、保证网络学习质量具有重要的意义。

1 决策树方法的原理

决策树方法是非常有效的分类方法,类似一个流程图的树型结构,其中树的每个非叶子结点代表对一个特征的测试,决定了数据是如何划分的,而树的每个叶结点代表一个类别,树的最高层就是根结点。图1是和表1对应的决策树示意图,该决策树可以用于鉴别未来保险申请人的申请是高风险还是低风险[8]。

通过对样本集中各数据行内容的分析来创建决策树。根据给定的样本集,找到一个函数Y=f(X);使用该函数判别新样本的类别。该方法采用信息论中的概念,用信息增益作为决策属性分类判别能力的依据,进行决策节点属性的选择。根据主观题数据的特点,本文采用最典型的决策树方法C4.5[8],该方法构造简单,速度较快,容易实现。

2 基于决策树的主观题自动批改方法设计

将主观题批改转化为分类问题,具有不同关键词的主观题划分到不同类别,最终实现主观题的自动评分。主观题自动批改方法的大致流程如图2所示。

2.1 实验用例

整个实验基于weka软件完成,weka是一个免费的机器学习软件环境,包含了常用的机器学习方法。本文以一个常见的化学主观题为例来说明方法的有效性。

主观题:什么是分子?

标准答案:分子是保持物质化学性质的一种微粒。

关键词和相应的权值:关键词1:化学性质;权值:0.7,关键词2:微粒;权值:0.3。

学生答案1:分子是一种物质。

学生答案2:分子是一种微粒。

学生答案3:分子是保持物质化学性质的一种微粒。

2.2 实验结果

将标准答案、关键词、及其权值作为输入,构建如图3所示决策树。依据该决策树,假设该题满分为10分。学生1得分为0分;学生2得分为3分;学生3得分为10分。

3 结论

在主观题自动批改方法中,利用决策树从标准答案中提取批改规则,而且提取的规则描述简单,应用时只需将学生作业与批改规则进行对照,即可得出正确的分数,为主观题批改的数字化提供了一条途径。

实验的结果可以看出,为了提高批改的精度,需要进一步改进决策树方法,以进一步揭示标准答案与学生作业之间的关联,提高批改准确率。

参考文献

[1] 袁一达.网络教学的优势与不足[J].现代远距离教育,2008,5(119):44-45.

[2] 李志清.电子作业自动批改中问题的研究[D].湖南:湘潭大学,2003.

[3] 黄康,袁春风.基于领域概念网络的自动批改技术[J].计算机应用研究,2004(11):260-262.

[4] 冯娟,詹国华.基于数据挖掘技术的电子作业批改机制[J].中国教育信息化,2008(8):46-48.

[5] 刘建舟,刘晓华.主观题自动批改技术的研究[J].湖北工业大学学报,2006,4(21):62-65.

[6] 李佳林.在线考试系统中主观题自动阅卷的设计[J].中国教育技术装备,2008(24):113-114.

[7] 潘国清.受限主观题自动判分系统设计与实现[J].北京教育学院学报,2009,1(4):10-14,23.

[8] 邵峰晶,于忠清.数据挖掘原理与算法[M].北京:中国水利水电出版社,2006.

上一篇:工业设计专业教学管理改革探索 下一篇:行动导向教学法在《电机与电气控制技术》课程...