基于Web挖掘的远程教学系统研究

时间:2022-07-07 06:40:41

基于Web挖掘的远程教学系统研究

摘要:Web挖掘指使用数据挖掘技术在万维网数据中发现潜在的、有用的信息。文章通过对Web挖掘在远程教育中的应用进行分析,提出一种基于Web挖掘的远程教学服务系统模型,着重介绍了Web挖掘的基本过程。

关键词:数据挖掘;Web挖掘;远程教育

中图分类号:TP311文献标识码:A文章编号:1009-3044(2007)05-11423-02

1 引言

现代远程教育是随着现代信息技术的发展而产生的一种新型教育方式,是以现代远程教育手段为主,多种媒体组合的教育方式。具有完全动态、实时交互、易于协作、新颖全面等特点,学习者不再是被动的接收教师的知识,而是以学生自学为主,充分发挥学生自主学习的主动性、积极性及创造性,有利于个体化学习。但随着远程教育的开展,也出现了一些问题,譬如如何能够从众多的访问者的大量访问记录中提取其行为信息来指导系统、如何将远程教育从以网站为中心,以系统自身为中心转向以学生为中心,从而发现学生的访问习惯、学习兴趣、学习倾向等。有些问题虽可借助强大的搜索引擎和搜索技术解决,但仍然面临许多困难:查询信息的查询率和查全率低,返回很多不相关的结果;仅用关键字不能实现潜在的未知信息;信息个性化方面的设计难以实现等。

Web挖掘利用数据挖掘技术从Web访问数据中发现和抽取潜在的、有用的信息。将Web挖掘应用于远程教育,可以在海量的Web访问数据中发现学生的访问习惯,动态地为学生定制个性化的网站;能够发现学生的学习兴趣和学习倾向,给学生推荐其感兴趣的课程和学习资料。构建一个基于Web挖掘的远程教学服务系统,实现个性化的远程学习,真正体现出个性化远程教育。

下面先简单介绍数据挖掘和Web挖掘技术,然后给出基于Web挖掘的远程教学服务系统模型。

2 数据挖掘与Web挖掘

2.1 数据挖掘

数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘其实是一类深层次的数据分析方法。数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先未知,有效和可实用三个特征。

数据挖掘(Data Mining)技术是为了解决传统分析方法的不足,并针对大规模数据的分析处理而出现的,它就是架设在数据和信息之间的桥梁,通过数据挖掘工具可以发现隐藏在大量数据中的丰富知识(诸如规律、约束、模式等)。数据挖掘是信息技术自然演化的结果。数据挖掘可以广泛地用于各种应用。

2.2 Web挖掘

基于Web的数据挖掘技术简称为Web挖掘(Web Mining),Web数据挖掘是针对各种Web文档和访问数据,应用数据挖掘的方法,提取抽象的、潜在的有用的知识。根据Web挖掘中数据对象的不同,分为Web内容挖掘(Content Mining) 、Web结构挖掘(Structure Mining) 和Web使用记录的挖掘(Usage Mining)三种方式。其中内容挖掘是从文件内容及其描述中获取有用的信息的过程;而结构挖掘则是从人为的链接结构中获取有用的知识的过程;使用记录挖掘是从Web的存取模式中获取有价值的信息的过程。在Web挖掘过程中,有时将这三类数据融合在一起,以提高挖掘结果的质量。

2.3 Web挖掘的基本过程

2.3.1 数据收集

在Web挖掘中第一个很重要的步骤就是要为挖掘算法找到数据。在基于Web挖掘的远程教学服务系统中,除了学生基本信息,学习成绩记录等这样一些静态的数据外,还要记录用户访问行为,譬如学习者在访问远程教学服务网站时留下的数据信息,可以从Web服务器、服务器网络日记文件中收集数据,这些数据主要包含在服务器日志(Server log)、Error log(出错日志)和 Cookie文件中,服务器日志(Server log)一般分为三部分:访问日志(Access Log),日志(Agent Log),引用日志(Referrer Log)。

2.3.2 数据预处理

数据挖掘没有通用的工具,经常需要综合多种挖掘工具才能满足挖掘的需求,原始数据需要经过处理后才能有效实施挖掘算法。数据预处理主要是把 Web原始日志数据转化为适合数据挖掘的可靠的精确数据,就是把数据统一成标准的适于挖掘工具挖掘的格式。数据预处理的质量与Web挖掘的效率和结果紧密相关,其内容包括:数据清理、用户识别、会话识别、事务识别、路径补充等。

2.3.3 模式识别

模式识别是对预处理后的数据实施挖掘算法。模式识别的基本方法有:统计分析、路径分析、关联规则、序列模式、分类、聚类、频繁访问组、依赖建模等。

2.3.4 模式分析

模式分析的目的是根据实际应用,通过观察和选择,将发现的统计结果、规则和模型转换为知识, 再经过某种度量得到真正有价值的模式,即我们感兴趣的模式,采用可视化技术,以图形界面的方式提供给使用者。模式分析是Web挖掘中最后一项重要步骤。常用的手段有:信息过滤、可视化、联机分析处理等。

3 基于Web挖掘的远程教学服务系统模型

3.1 远程教学服务系统的主要模块

3.1.1 数据库模块

①教学内容数据库:存储各门课程的教学信息。譬如课件、试题等。

②学生基本信息数据库:存储学生的基本信息,譬如学号、姓名、学历等。

③学生学习行为数据库:存储学生学习的内容、学习的时间、学生浏览网页的网址等。

④学生学习情况数据库:存储学生学习的成绩、学习的进度等。

3.1.2 功能模块

①学习调度系统:根据学习内容界面呈现系统产生的个性化教学模式,从教学内容数据库中提取学习内容,供学生学习、作业、考试和答疑等,并能将学生的相关学习成绩、进度等送入学生学习情况数据库。同时记录学生的学习行为送入学生学习行为数据库。

②Web挖掘系统:对学生学习行为数据库、学生基本信息数据库和学生学习情况数据库的信息进行预处理,结合相关数据,通过路径分析、关联规则、序列模式、分类聚类等技术,应用挖掘算法进行数据挖掘,找出最适合学习者的学习模式,并将他送到个性化学习内容提取系统。

③个性化学习内容提取系统:接收来自Web挖掘系统传来的信息,自动更新站点页面间的链接,产生更适合该学生的学习课件等信息。

④学习内容界面呈现系统:接收来自学习调度系统的信息,从学生学习情况数据库中读取该学生用户学习记录,产生适合该用户的学习内容查询索引程序,送到教学内容数据库中,再由教学内容数据库返回相关的学习内容索引,产生适合该用户的学习模式,送到学习调度系统。

3.2 基于Web挖掘的远程教学服务系统模型图

基于Web挖掘的远程教学服务系统模型图,如图1所示。

图1 系统模型图

4 结语

以上是对远程教育教学模式的探索和研究,所提出基于Web挖掘的远程教学服务系统是远程教育的一种新模式,能充分利用站点上积累的各种信息,提取并分析不同学生的个性特征,自动组合课程内容和页面链接,因人而异地提供所需的学习内容,符合现代远程教育教学规律和学生的学习习惯,有利于远程教学。

参考文献:

[1]黄茜.Web日志挖掘在个性化网络教育中的应用[J].现代教育技术,2004,14(5):52-55.

[2]曲春锦.改进的关联规则挖掘算法及其在教育信息挖掘中的应用[J].交通与计算机,2005,23(4):68-71.

[3]李华,何茜,吴中福.基于Web的个性化学习系统研究[J].计算机工程与应用,2002,(13):239-242.

[4]胡国强. 数据挖掘在远程教育决策支持系统的运用[J].开放教育研究,2003,(5)44-45.

本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。

上一篇:巧用Word“域”实现图表公式自动编号 下一篇:巧用PhotoShop换衣服花色