高校信息化中数据挖掘现状调研及应用研究

时间:2022-07-27 09:33:39

高校信息化中数据挖掘现状调研及应用研究

摘要:数据挖掘是从海量数据中抽取出有价值知识的有效工具,数据挖掘是针对数据进行处理较为成熟的技术。目前数据挖掘技术应用范围广泛,并且取得较为显著的效果。高校信息化建设的快速发展下产生了大量信息,数据挖掘技术以应用到高校信息化建设中如:招生就业、教学管理和教学模式等方面,并且具有指导意义和作用。

关键词:高校信息化 数据挖掘 应用研究

中图分类号:TP311.131 文献标识码:A 文章编号:1007-9416(2016)04-0000-00

高校信息化建设高速发展,使得在高校教育信息中产生大量的数据。如何使这些数据为教育教学所用,对于这些问题急需解决,数据挖掘技术是目前对数据处理比较完善的技术,它可以将隐藏在数据背后的有用信息提取出来供人们使用,以此提高质量和效果。

1 数据挖掘的定义及挖掘步骤

1.1 数据挖掘的定义

数据挖掘(Data mining),又称为信息勘探、数据采掘。其实质就是从大量的数据中通过多种算法搜索隐藏于其中有用信息的过程。数据挖掘也有学者将其称之为知识发现(Knowledge Discovery in Database,以下简写为“KDD”)。而在学术领域,学者们对“数据挖掘”和“知识发现”这两个概念的内涵和外延一直缺乏比较明晰的界定,直到1996年,数据挖掘研究专家Usama Fayyad等在KDD国际会议上对上述两个术语进行了定义及区分:所谓知识发现(KDD)是指数据库中知识发现的全过程,而数据挖掘仅仅是知识发现(KDD) 过程中的一个特定步骤,即数据挖掘包含于知识发现过程中,属于从属关系。

1.2 数据挖掘步骤

(1)确定挖掘对象、目标。确定挖掘对象便于后面数据采集,明确目标便于分析。建立分析的先决条件是对问题和目标的清晰描述。本文中的挖掘对象是信息技术系2013级计算机应用技术专业学生《网页设计》课程成绩,挖掘目标是影响《网页设计》课程成绩的因素有哪些,为作者及带同一门课的教师提供参考依据。(2)数据的收集。根据数据分析对象,从数据分析中提取特征信息,选择适合的方法采集数据并将采集的数据输入到数据库。这个阶段是一个量大的工作,并占用了大量的时间。本文中的成绩数据通过学院“学生成绩管理系统”获得,其他数据通过调查表获得。(3)数据预处理。接下来清理收集数据。由于数据库中的数据一般是不完整的、噪声的和不一致的,为了确保数据的完整性需要将这些数据清理出去。(4)数据转换。为了更好的建立适合挖掘算法的分析模型需要对数据进行转换。(5)分类挖掘知识和信息、选择合适的技术和算法在处理和转换后的数据集中进行数据挖掘,通过合适的编程语言实现算法,其目的是确定分类模型。(6)知识的表示――生成分类规则。知识的表示最终的目的是生成分类规则,通过获取的信息进行解释和评价。(7)知识的应用。将生成的分类规则应用到实际工作中以促进和提高工作质量。

2 数据挖掘常用的方法

2.1 统计分析法

数据挖掘涉及到多个科学领域,统计领域就是其中一个。统计分析法(statistical analysis method)是数据挖掘中的基本技术,其方法是从总体当中选取样本,通过对样本的分析获取样本数据的内在特征,并由其推断总体特征的一种方法。统计分析方法的思想是在数据集中假设一个概率模型然后根据模型采用相应的方法进行挖掘。此方法的特点是结果精准且易于理解。

2.2 关联规则法

数据挖掘中的一个重要内容是关联规则法(Association Rules),关联规则对数据挖掘的主要思想是:在数据库中发现N(N>=2)个变量之间的规律。关联可以分为简单关联(Simple correlation)、因果关联(Causal association)、时序关联(Temporal association)。关联规则法在现实中比较实用。

2.3 决策树法

决策树(Decision Tree)法是数据挖掘中常用的方法之一,决策树使用概率论原理,它用树形图来描述挖掘结果。决策树由树根、树枝、树叶、概率值、损益值。决策树的构建方法是通过样本数据集进行计算后构建决策树模型,通过决策树模型提取分类规则,最终形成人们易于理解的规则结果。本论文研究过程使用的就是决策树法,在后面着重介绍决策树法及它的常用算法。

2.4 神经网络法

神经网络(Neural Network)体现了数据挖掘多学科交叉的特点。它是非线性动力学系统,特色是信息的分布式存储和并行协同处理。神经网络法主要研究方面是人工神经网络、网络模型和理论模型的建立。神经网络法的特点是高度并行性、泛化能力等,常用于医学、生物学等领域。

3 数据挖掘在高校信息化建设中的应用

3.1 数据挖掘在学生成绩中的应用

高校的连年扩招和高校信息化建设的迅速发展,各个学校都应用校园信息化平台,获取并收集了大量的学生基本信息数据和学业水平数据信息。目前对于学生成绩的处理还是处于简单的统计、排序、查询等阶段,对于学生如何取得这样的成绩,教师针对学生如何调整教学方法等问题无法通过简单阶段获得,通过数据挖掘技术的应用,帮助教师获取更多能有助于教学有价值的信息,为老师的教学工作提供一定的决策依据,进而提高教学质量。

3.2 数据挖掘在教学管理中的应用

教学管理工作涉及教师和学生两个方面如:人才培养计划、课程建设、成绩分析和教学评价等,它们之间存在联系,通过数据挖掘将这些数据中的规律挖掘出来,提供教学管理者参考,以提高教学质量。

3.3 数据挖掘在招生就业中的应用

高校招生工作一直影响着高校的建设和发展,高校招生数据中反映出生源质量、分布、报到率等信息,对于专业建设提供参考依据,从而决定人才培养方案、课程建设、专业定位等方面,专业建设影响着高校的人才培养质量及就业质量。

3.4 数据挖掘在课堂教学质量评价体系中的应用

高校教学发展的重要因素为教学质量,教学质量提高的有效机制是教学质量评价体系,通过对课堂教学质量评价体系中数据进行挖掘,证明了评价体系对教学管理者的可用性并提供了重要决策依据。

收稿日期:2016-03-09

作者简介:王莉红(1980―),女,甘肃兰州人,本科,毕业于兰州大学,讲师,研究方向:数据挖掘。

上一篇:基于公司治理的中国民营企业接班人选择研究 下一篇:关于MIMO雷达技术及其应用的研究