高校信息化下数据挖掘技术应用研究

时间:2022-09-26 12:52:02

高校信息化下数据挖掘技术应用研究

摘 要:随着高校信息化建设的逐年投入,在校园网络中运行的各种应用系统中积累的数据在急剧增加,如何从大量的数据中发掘出有价值的信息,最大限度的发挥数据价值,成为高校亟待解决的问题。

关键词:数据挖掘;关联规则;信息化

中图分类号:TP311.13

随着信息技术的发展,各高校建立了必要的基础设施和应用系统,利用先进的现代信息技术、手段和工具实现了校园内部各项资源的信息化,形成了一个完整的、独立的信息化空间,使得现实校园在时间和空间上延伸开来。由于高校内部不同行政管理部门之间的协调问题,在高校中运行了纷繁复杂的系统,不同应用系统之间数据存在千丝万缕的联系,导致出现许多冗余数据,数据质量不高消弱了数据利用的价值。这就必须借助数据挖掘技术去发现数据中隐藏的规律,为知识管理决策提供科学依据和更有效的支持。

1 数据挖掘定义及挖掘过程

1.1 数据挖掘的定义

数据挖掘(Data Mining,DM),又称数据库中的知识发现,是指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中揭示隐含的、先前未知的并有潜在价值的信息和知识的过程。数据挖掘过程不是线性的,而是反复循环的。从大量数据中发现有用的信息、规则等知识是一个系统的过程。

1.2 数据挖掘的一般过程

数据挖掘的过程可描述为,在确定了数据挖掘的目的之后,在各类相关的信息中选择适于数据挖掘的数据,接着对数据进行初步处理,然后针对某一数据挖掘算法建立分析模型,选择合适的挖掘算法进行数据挖掘。主要包括数据准备、数据挖掘、评价和解释等几个阶段。

(1)数据准备

熟悉背景知识,弄清用户的需求,明确定义要解决的问题,针对性的从已存在的数据仓库中提取相关数据,进行数据收集,建立数据挖掘库。

(2)数据挖掘

从数据中找出相关规律和相应的趋势,发现各因素间的相关性,选择数据挖掘算法,如关联规则、分类预测、聚类规则等对数据进行深入调查,进一步明确和量化问题解决的要求,根据问题的需求对数据进行增删,甚至形成新变量以对状态进行有效的描述,通过采用数据挖掘中的相应分析方法来建立模型。

(3)评价和解释

通过评估来确定有效的、有用的模型。因为数据挖掘得到的模型可能会是没有实际意义或没有使用价值的,也可能是不能准确反映数据真实意义的模型,甚至有可能是一些与事实相反的模型,因此需要对所得到的的挖掘结果进行评价,以去除无效的模型。

2 主要的数据挖掘方法

2.1 关联规则

关联规则是发现数据库中数据项之间所存在的关系规则,即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现,即隐藏在数据间的关联或相互关系。它们经常被表达为如下形式的蕴含或规则形式:X=>Y,可以解释为满足X的数据库元组也可能会满足Y。在客户关系管理中,通过对企业的客户数据库里的大量数据进行挖掘,可以从大量的记录中发现有趣的关联关系,找出影响市场营销效果的关键因素,为产品定位、定价与定制客户群,客户寻求、细分与保持,市场营销与推销,营销风险评估和诈骗预测等决策支持提供参考依据。

2.2 分类与预测

分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,构造出一个分类模型,该模型能够把数据库中的数据记录映射到给定类别中的某一个,从而可以应用于数据预测。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等,如一个汽车零售商将客户按照对汽车的喜好划分成不同的类,这样营销人员就可以将新型汽车的广告手册直接邮寄到有这种喜好的客户手中,从而大大增加了商业机会。

2.3 聚类规则

聚类分析是把一组数据按照相似性和差异性分成几个类别,这主要是把一组按照相似性归纳成若干类别,也就是“物以类聚”。其目的是让同一类别的数据间的相似性尽可能增大,不同类别中的数据间的相似性尽可能减少。

3 数据挖掘技术在高校信息化建设中的应用

3.1 利用数据挖掘技术促进知识管理

学校在长期的信息化建设中形成了大量数据资料,由于不同工作部门之间工作协作关系,导致积累了大量的冗余信息,利用数据挖掘技术从纷繁复杂的数据中挖掘有价值的知识,建立充分利用这些数据的意识,通过数据总结、数据分类、数据聚类和关联规则发现学校中的隐式知识和显式知识,推进对知识的创新、获取、加工、存储、传播和应用的管理,建立以数据为中心的知识管理模型。

3.2 利用数据挖掘技术促进课程体系建设

根据职业人成长的规律,各专业课程的设置是循序渐进的,课程与课程之间也是有一定的关联和前后顺序关系。学一门较高级课程之前,必须要先修一些先行课程,例如计算机专业学生在学习数据结构这门课程之前,需要先学习语言程序设计等等课程。一旦先行课程没有学好,则会影响后续课程的学习。另外,同年级学习相同课程的不同班级,由于授课教师、班级文化的不同,班内学生的总体成绩也会有所差异。每个学期安排课程的多少,也会影响学生学习效果。我们可以利用学生的学习成绩数据库中存放的历届学生各门学科的考试成绩,结合数据挖掘的关联分析与实践序列分析等相关功能,从这些海量数据中挖掘出有用的信息,帮助分析这些数据之间的相关性、回归性等性质,得出一些很有价值的规则和信息,找到影响学生成绩的原因,并在此基础上对课程设计做出更加合理的安排。

3.3 利用数据挖掘技术改进教学评价方法

教学质量是整个教学过程的中心环节,是人才培养质量的重要保证,是对学校办学水平进行综合评价的重要组成部分。教学质量高低是教学活动的成效性外在表现形式,而良好的教学评价对教学质量有导向、促进、激励及调控功能,是学校教学管理工作的重要组成部分,是评价教学工作成绩的主要手段,对教师的客观评价体现了教师在教学过程中的综合能力。教学质量评价是一个多维性评价指标体系,包括课程组织、行为管理、学生成绩评定和师生关系等。教学质量评价指标体系具有多因素性、模糊性、多样性以及评估功能的鉴定性和诊断性等特点。如何从现有的大量评价数据中挖掘出内涵的、潜在的、有用的数据非常重要,并对这些数据进行准确地、科学的分析,是一个复杂的系统工程。利用数据挖掘算法从教学评价数据中进行挖掘,分析各种因素之间隐藏的内在联系,探索教学效果的好坏与教师的年龄结构、职称结构、学历结构之间的关系,课堂教学效果与教师整体水平的关系,正确、有效地利用这些数据评价教学质量和教学效果,进而建立行之有效的教学评价模型,更好的为学校专业教学评估和日常教学工作服务。

4 结束语

在高校信息化管理中,通过数据挖掘技术能使管理者获取有价值的关键性数据,为科学决策提供依据。因此,采取科学的数据挖掘技术对智慧型校园建设具有重要的作用。

参考文献:

[1]谭建豪.数据挖掘技术[M].北京:中国水利水电出版社,2009.

[2]王树利.基于数据挖掘技术的高校教学管理信息化研究[J].江苏科技大学学报(社会科学版),2009.

[3]胡春红.数据挖掘技术在高校信息化管理中的应用[J].长江大学学报(自然科学版),2010.

[4]曹路舟.数据挖掘技术及其应用初探[J].科学文汇(下旬刊),2012.

[5]赵映川.大数据时代院校研究的发展与突破[J].高校教育管理,2013.

作者简介:侯宇(1983.03-),男,苗族,贵州铜仁人,讲师,研究生,研究方向:计算机网络安全方面。

作者单位:铜仁职业技术学院,贵州铜仁 554300

上一篇:油田科研项目管理系统 下一篇:基于Java会议管理系统的设计与实现