数据挖掘技术在数字化校园中的应用

时间:2022-10-23 10:11:13

数据挖掘技术在数字化校园中的应用

摘 要:数据挖掘技术是指一种通过某种方法与策略从一切实际应用数据中将某些人们事先未掌握的、潜在但确实存在一定利用价值的信息与知识最大成度地提取出来并对其进行加工的技术;数字化校园则是在以互联网为依托的情况下,充分利用一切可以利用到的信息化策略及相关设备,继而从包括教学环境、教学资源以及教学活动等方面实现校园整体性的数字信息化管理。文章主要阐述了数据挖掘技术在数字化校园中的应用相关情况。

关键词:数据挖掘技术;数字化校园;应用

中图分类号:TP393 文献标识码:A 文章编号:2095-1302(2014)01-0068-03

0 引 言

信息的分析与处理是重要的人类活动之一,但随着当前社会信息化进程的不断加快,其整个社会的信息量也表现出成倍的增长趋势,当某一种数据库所包含的数据日益庞大的情况下,传统或简单的数据统计方法自然也会逐渐表现出诸多的不适用。尽管眼下的多数数据库系统仍可比较高效地进行数据的录入、查询以及统计等操作,但对于这些数据可能存在的某些关联与规则却无法实现理想掌握,在此种情况下也无法通过现有数据实施未来发展可能性的推断。在这样一个“数据爆炸”的时代,如果不具备挖掘数据背后隐藏的知识的能力,势必也会出现“知识匮乏”的现象。当人们意识到此问题所在之时,其对信息的态度也正在由简单的数据收集型向分析加工型转变,并期望从同样的数据信息中挖掘出更多可加以利用的信息,数据挖掘(DM)技术即是在此时代背景中诞生的。就近些年的情况来看,DM技术的相关研究不仅愈发变得炙手可热,而且已经在诸如商业、金融业、企业生产以及市场营销等很多领域获得了实际性的广泛应用,比较之下,其在教育领域的应用却相对偏少。基于此,笔者特针对DM技术在数字化校园中的应用进行一定阐述,旨在为DM技术在教育领域的应用开发提供一定参考价值。

1 DM技术与数字化校园的概念与内涵

1.1 DM技术的概念与内涵

DM技术即是指一种通过某种方法与策略从一切实际应用数据中将某些人们事先未掌握的、潜在的、但确实存在一定利用价值的信息与知识最大程度地提取出来并对其进行加工的技术称谓。具体开展DM的方法种类是多样的,但其中最具代表性的通常包括了分类分析法、关联分析法以及序列模式分析法等,而经常需使用到的工具则主要包括了IBM公司Almaden研究中心开发的QUEST系统,SGI公司开发的MineSet系统,加拿大Simon Fraser大学开发的DBMiner系统,SAS Enterprise Miner,IBM Intelligent Miner,Oracle Darwin,SPSS Clementine以及Unica PRW等。在针对具体应用实际的情况下,通过选用以上DM工具可以帮助人们发现某些未知的数据含义,进而开发其价值以预测或指导未来可能发生的情况与需要采取的行为,总之就是为人们的决策行为提供全方位的数据信息支持。

1.2 数字化校园的概念与内涵

数字化校园即是在以互联网为依托的情况下,进而充分利用一切可以利用到的信息化策略及相关设备,继而从包括教学环境、教学资源以及教学活动等方面实现校园整体性的数字信息化管理。由此可见,与传统的校园建设比较而言,通过对校园实施数字信息化的建设后,不仅将使得校园的发展具备了更加明显的时代性,而且还能够将学校发展过程中的某些实际成效及时展现出现,同时也能及时地从中发现可能存在的管理方面的问题,并对学校在未来一定时间内的发展趋势做出比较符合实际的预测,最后,在数字化的校园管理模式下,其校内的相关资源配置将进一步得到优化,这势必也将促进校园的整体建设可逐步得以完善。

2 在数字化校园建设中采用数据挖掘技术的需求分析

2.1 学校教学与教学评价方面的需求分析

一方面,教学是学校最核心的任务,那么教学部分的数据挖掘也自然是数字化校园建设的核心部分,现以教学过程中的课程设置为例,在学校,学生的课程学习是循序渐进的,而且课程之间有一定的关联与前后顺序关系,在学一门较高级课程之前必须先修一些先行课程,如果先行课程没有学好,势必会影响后续课程的学习,另外,同一年级学习同一课程的不同班级,由于授课教师、班级文化的不同,班内学生的总体成绩相差有时会很大,利用学校教学数据库中存放的历届学生各门学科的考试成绩,结合数据挖掘的关联分析与时间序列分析等相关功能,就能从这些海量数据中挖掘出有用的信息,帮助分析这些数据之间的相关性、回归性等性质,得出一些具有价值的规则和信息,最终找到影响学生成绩的原因,在此基础上对课程设置作出合理安排;另一方面就是教学评价的数据挖掘,教学评价是对其重要的调节、控制、指导与推动手段,而且可发挥重要的导向作用,也更是学校教学管理的重要组成部分,基于此,针对教学评价管理中出现的某些问题给予科学地解决就显得格外重要,此方面的问题又包括:影响教学评价的关键因素有哪些?教学评价的指标与关键环节的合理性如何?在具体的教学评价中的各级得分者的特征如何?教学评价的可疑数据可通过什么方式给予剔除?通过数据挖掘后,诸如此类的问题均有望得以明朗化,继而更科学地实施教学评价以确保可真正扫清教学工作中存在的障碍。

2.2 教师结构和专业配制方面的需求

在当前高校扩招的大潮流中,我高职院校也占据了相当比例,由此所导致的师生比例失调的问题、新增设专业教师的稀缺问题以及具体每个专业的教师人员结构与专业领域的重组问题等等,均是迫切需要解决的问题。通常采取的做法自然是通过一定措施来引进新的教师队伍并留住人才,然而在这个过程中,还包括很多细节的问题:现有的教师哪些即将流失? 现有教师他们的流失概率如何?哪些因素造成了教师的流失? 教师流失对学校会造成什么影响? 教师的流失情况有什么差别? 如何制定科学的用人制度?等等问题,通过应用数据挖掘技术后,便有望在高职院校变被动为主动地科学人用。

2.3 学校的科研管理需求

学校所开展的科研项目对于教学内容的革新、教学质量的提升以及教师学术水平的提高均具有极大的推动作用,同时,其成效也是衡量经费分配与职称评定的重要参考依据。在此基础上,改进与完善科研评价制度自然就成为了学校迫切需要解决的问题,这些问题主要包括:在各类级别期刊上的相关教师所具备的特征、各种课题申请者的特点、未完成科研任务教师的特征、影响教学科研进展与成效的因素、科研滚动周期的最佳年限、科研工作量应该如何设定以及科研项目存虚存假的可能性等。而通过DM技术可将这些问题均得以不同程度地解决,如此也必将更加有效地激励教师科研的执行力与创新水平,整体加快学校科学事业的进展。

2.4 数字化图书资源的管理需求

图书馆最大价值化的存在,无疑要全面了解并掌握所有读者的分类、属性以及特征等方面的情况,同时还需充分掌握读者在应用图书馆后的满意度情况以及是否有新的需求,图书所涉及学科的交叉问题等等,这均是当代学校图书馆亟待解决的问题。而数字挖掘技术正能实现对以上信息的深加工,继而在对相关数据进行分析后进一步指导图书馆的馆藏建设,同时还可为学校的学科课程设置提供一定参考价值的科学依据,最终推动学校图书馆业务与相应管理的全面进步。

其他还比如有在人力资源管理方面、学校的教务管理以及住校学生生活消费管理等等,其各自存在的问题均可在充分应用数据挖掘技术的基础上找到相关突破口,最终在整体上全方位地实现学校各方面资源的优化管理与合理配置,持续提升学校数字化建设进程的速度。

3 数据挖掘在数字化校园中的应用研究

通过了解,数字化校园的数据管理平台是一个集成了学校多方面应用系统的综合性平台,将所能收集到的所有数据均储存在学校的数据中心的共享数据库里面。但在储存的过程中,还需对这些数据进行详尽的分类处理,并充分考虑到其可能存在的不完整性、模糊性与随机性等,而通过数据挖掘对这些信息的充分提取与整理,继而生成与之相对应的应用决策系统,最终为相关领导做出正确的决策提供更为丰富的可靠的参考信息。数据挖掘在数字化校园中的具体应用结构图如图1所示。

如上述介绍以及上图均可以看出,DM技术在校园数字信息化建设中可说是一项颇具复杂性与繁琐性的特殊工作,因此其具体应用情况的介绍限于篇幅限制,笔者在此仅以学校的科研管理为例,并应用Clementine挖掘工具进行操作,现对其相关数据挖掘技术的实际应用情况展开一定剖析。

3.1 对不能完成科研任务教师的相关分析

在实际的学校科研项目管理过程中,其中项目进度的管理是一个比较重要的环节,而与项目进度相关的因素中,又会存在个别教师可能因多方面原因而出现不能完成既定科研任务的情况,而只有通过科学的对其实施预测,才能让诸如此类的问题得以最大程度地解决。其具体的解决思路主要就是要把这个问题定义为一个分类预测的问题,那么首先需要做的就是将参与科研项目的教师分为两类,其中一类为已完成科研任务量者,而另一类则是尚未完成科研任务量者。接着分别从此两部分教师中选择一定数量的教师,并统计其相关属性数据继而组成训练数据集,然后再通过应用神经网络与决策树等办法建立起科研工作量完成情况的实际分类模型,最后再利用该模型来进行科研任务量完成情况的实际预测,如此便可获得可能会不能完成科研任务教师的相关信息,为学校后期的科研计划的制定提供参考依据。

3.2 教师不能完成科研任务的实际原因

在了解到可能完不成科研任务的教师后,还更需要对导致此种情况发生的原因进行必要的分析,进而可在以后保证其能最大程度地去完成科研任务。此方面的数据挖掘处理具体来说主要包括两个方面的措施。一方面,可以运用关联分析的办法,把科研任务量的完成情况看作一个实际目标变量,而把与之可能相关的某些属性数据作为变量,一起输入系统后在运用GRI模型展开分析,进而可初步找出具体有哪些属性可对科研完成的情况造成影响;另一方面,就是应用决策树的方法来获得科研工作量完成情况的规则集。以具体的某学校为例,以APRIORI算法为基础来对教师科研任务量完成情况的影响因素进行分析,设定0.3为最小支持度与最小置信度,继而对挖掘的结果实施分析,所获得的最终结果为:基础学科有38%的教师不能按时完成,82%的文科教师可以完成,75%的年轻教师可以完成,95%的高级教师可以完成等等,如此一来,便能很清楚地获得对科研任务量完成情况的影响因素,比既往的方法便捷了很多,同时也显著提高了工作效率。

3.3 学校科研管理中对教师的分类

在寻找到影响教师不能完成科研任务量的原因之后,接下来还必须完成的工作就是要对教师实施明确的分类,继而便于针对具体情况的不同类教师建议采用不同的策略来最大程度提升科研任务的完成率。打个比方,我们可以把学校看为一个企业,而把教师视作企业的客户,因此对教师实施分类的问题亦即是对企业客户进行细分的问题,通过分类后,自然更便于将那些特别需要关注的“客户”找出来,继而采取相应的实际措施来改善部分教师不能按时完成科研任务量的问题。下面笔者以聚类算法为例对教师细分过程中所采用到的实际算法应用进行一定说明,本算法主要是采用逐步减少K值的方式进行尝试。职称与学历等均是影响是否能完成科研任务的主要因素,因而需将这些相关的数据均作为参数给予输入,比如先将K值假定为8,接着通过对K值的大小进行连续调整,最终或许可以发现,比如当K值为4时,其效果最为理想,然后便可运用决策树对此类与其他类型的因素进行相同的分析,对每位教师的具体情况实施深入挖掘,最终分析出导致其不能完成科研任务的所有影响因素。通过此种在给予分类基础上的实际算法的应用,教师科研工作中所存在的问题就能很容易被挖掘出来。

4 结 语

综上所述,对数字化校园的建设而言,数据挖掘技术不仅是一项迫切需要掌握的全新技术,而且也是一项有着必要性、重要性与繁琐性的工作项目,因此有必要更加重视其在数字化校园建设中的作用与效果。与此同时,笔者认为,当代的学校管理自然也需要现代化的管理方式,数据挖掘技术的诞生与不断发展,也势必能为校园数字化建设提供更为有利的帮助,这也是有助于学校实现数字信息化最有利的保证。笔者相信,在不久的将来,数据挖掘技术将会在校园数字信息化建设中发挥出更为突出的作用。

参 考 文 献

[1] 陈薇.数据挖掘在数字化校园的研究与实现[D].杭州:浙江大学,2006.

[2] 丁智斌,衰方,董贺伟.数据挖掘在高校学生成绩分析中的应用[J].计算机工程与设计,2006,27(4):590-592.

[3] 谷琼,朱莉,蔡之华,等.基于决策树技术的高校研究生信息库数据挖掘研究[J].电子技术应用,2006(1):20-21.

[4] 姜卫俭,程从从.数据挖掘技术在校园信息化中的应用研究[J].科技广场,2009(5):72-74.

[5] 蔡会霞,朱洁,蔡瑞英. 关联规则的数据挖掘在高校图书馆系统中的应用[J]. 南京工业大学学报:自然科学版,2005,27(1):85-88.

[6] 邹晶晶.数据挖掘技术在数字化校园中的应用[D].长沙:中南大学,2009.

[7] 陈琴.数字化校园中数据挖掘技术的应用研究[D].武汉:华中农业大学,2009.

上一篇:无线传感网络中的RPL路由协议研究 下一篇:智能安全帽工地管理系统