基于Web数据挖掘的个性化学习系统研究

时间：2022-02-28 12:32:06

基于Web数据挖掘的个性化学习系统研究

摘要：结合Web数据挖掘在E-learning平台中的应用，分析了Web数据挖掘的基本过程与关键技术，提出了一种基于Web挖掘的个性化学习平台模型，并阐述了Web挖掘在平台中的应用及其个性化搜索引擎的实现。

关键词： E-learning应用平台； Web数据挖掘；个性化学习；个性化搜索引擎

中图分类号：TP392；G434 文献标志码：A 文章编号：1006-8228（2013）09-05-03

0 引言

计算机通信技术的日益强大支撑了建设学习型社会的需求，远程教育借助它的灵活性与选择性渐渐走进人们身边，成为学习的一种普遍方式。自1996年我国开通了“中国教育与科研计算机网”，开放、灵活的E-learning便迅速被人们所接受并应用于各种网络学校和远程教育之中。

随着时间的推移，人们要求不仅仅只是远距离的教学，更多的是个性化的学习。个性化教育理论认为，学习过程应是针对学生个性特点和发展潜能而采取恰当的方法、手段、内容、起点、进程、评价方式等，促使学生各方面获得充分、自由、和谐发展的过程[1]。但是目前的远程教育学习系统并不令人满意，首先是系统缺乏智能性，学习系统面对的用户并非是一类人，而是不同背景、不同目的、不同时期的一系列请求，面对这些请求，缺乏智能化的系统就难以实现因材施教；其次是缺乏有效的监督机制和有效的学习帮助支持，导致学生偏离学习目标、遇到困难时不能及时得到帮助；再者是有用的教学资源没有被有效利用，造成了资源的极大浪费。“以人为本”的教育理念的逐渐普及，个性化学习方案总体上应该做到学习资源的多维性、学习价值追求的多重性、学习风格的独特性、学习过程的终身性和学习方式的自主性。

基于Web智能的网络教育是现代远程教育的一种重要手段，其可以通过网络来营造虚拟的学习环境，在一个平台上向学生提供丰富的学习资源，从而帮助学生开展基于资源的探究式学习；在虚拟的学习环境中，教师和学生、学生与学生间可以方便地进行同步或异步的交互。数据挖掘便是实现Web智能网络教育的重要方法，主要是通过获取学习者在Web上的学习过程行为数据，如访问信息、时间、次数及喜好等，经过挖掘流程处理，得到学习者的模式规律，从而给学习者提供良好的个性化服务[2]。

1 Web数据挖掘相关分析

1.1 Web数据挖掘基本过程

Web是一个强大的交互环境，所以Web事务度量就需要数据的获取与处理，Web数据挖掘指的是从大量的、不完全的、蕴含的、模糊的WWW资源上提取隐含在其中有用的信息和知识的过程。其处理对象是大量的业务数据，目的是为了提取有价值的知识，提高信息利用率。Web数据挖掘又被称为资料探勘或者数据采矿，是数据库知识发现中的一个步骤。根据大量业务数据的不同类型，Web数据挖掘可以分为：Web内容挖掘、Web结构挖掘、Web使用挖掘[3]。其中，Web内容挖掘是挖掘Internet的页面和后台交易数据库，包括结构化的数据挖掘与非结构化的数据挖掘。无论是哪种数据挖掘，都是为了寻找隐藏着的、大量的、有价值的信息，并且为Web提供更好的服务。

以下给出Web数据挖掘的基本流程。

⑴ 目标数据采集：数据采集就是要记录用户访问行为。数据来源包括服务器端、客户端和端。为了有效地实施挖掘算法，仅仅采集数据是不够的，还需要进行下一步操作：预处理。

⑵ 预处理：目标数据经过预处理才能有效的实施挖掘算法，也就是从目标数据集中除去明显错误数据和冗余的数据，进一步精简所选数据的有效部分，并将数据转化为有效形式。数据的预处理的质量与Web挖掘的效率是紧密相关的。内容包括数据净化、用户识别、会话识别、事务识别及路径补充等。

⑶ 模式发现与分析：模式发现就是对预处理后的数据实施具体的、合理的挖掘算法或综合应用不同的算法。其最终目的是发现用户的访问模式，预先为用户设定学习内容类别。模式分析的目的是根据实际应用，通过观察和选择，将模式发现的统计结果、规则和模型转换为知识，经过筛选后用来指导实际应用，也就是在预先的类别中再次为用户提供个性化资源和学习支持服务。

⑷ 用户反馈：利用数据挖掘与学习内容绑定等各种技术，学习者的学习过程会是以可视化方式进行指导。

1.2 相关算法分析

协同过滤这一概念最早出现在1992年，由Goldberg、Nicols、Oki及Terry提出，随着大大小小系统的应用，协同过滤推荐迅速成为Web数据挖掘中一种很受欢迎的技术。该技术分析用户兴趣，在用户群中找到指定用户的相似用户，综合这些相似用户对某一信息的评价，形成系统对该指定用户对此信息的喜好程度预测[4-6]。

相似性计算是协同过滤推荐算法中最关键的一步，传统的相似度计算方法有三种。

⑴ 余弦相似性

把用户评分看做n维项目空间的向量，用户间的相似性通过向量间的余弦夹角度量，设用户i和用户j在n维项目空间上的评分分别表示为向量k，e，则用户i和用户j之间的相似性为：

Sin（i，j）=cos（k，e）= ⑴

⑵ 修正的余弦相似性

余弦相似性度量方法中没有考虑不同用户的评分尺度问题，修正的余弦相似性度量方法通过减去用户对项目的平均评分来改善上述缺陷，设经用户i和用户j共同评分的项目集合，则用户i和用户j用户之间的相似性为：

Sin= ⑵

其中，Rij代表用户i对项目c的评分，和分别表示用户i和j对项目的平均评分。

⑶ 相关相似性

设经用户i和用户j共同评分的项目集合用Iij表示，则用户i和用户j之间的相似性sin（i，j），通过Pearson相关系数度量：

归根结底，三种相似方法均为基于向量的相似度计算方式，进行对象属性之间的严格匹配。

余弦相似性度量方法把用户评分看作一个向量，用向量的余弦夹角度量用户间的相似性，然而没有包含用户评分的统计特征；修正的余弦相似性方法在余弦相似性基础上，减去了用户对项目的平均评分，然而该方法更多体现的是用户之间的相关性而非相似性。相关性和相似性是两个不同的概念，相似性反应的是聚合特点，而相关性反映的是组合特点；相似相关性方法，依据双方共同评分的项目进行用户相似性评价，如果用户间的所有评分项目均为共同评分项目，那么相似相关性和修正的余弦相似性是等同的，用户对共同评分的项目集稀少，使得相似相关性评价方法实际不可行。

2 基于Web数据挖掘的个性化学习系统模型

基于Web数据挖掘的个性化学习系统采用的是三层B/S模型，如图1所示。

个性化与智能化功能模块的实现都是以Web为基础的。服务器是一个核心，用户通过客户端发送一系列请求，Web服务器作出相应的响应，也就是在后台数据库中查询信息，查询到的信息再返回给Web服务器，最后服务器通过网页的形式呈现及反馈给用户。

2.1 主要功能模块分析与设计

基于Web数据挖掘的个性化学习系统主要是由学习者、学习者个人秘书、管理员、个性化推荐引擎及教学资源等模块构成。其中系统的核心部分是“学习者个人秘书”。当学习者通过身份验证后，便会进入个人的学习页面。“学习者个人秘书”根据学习者的访问习惯和学习者提交的要求等信息进行自动整合（这里主要是由用户信息收集和用户信息建模两个模块来实现），并进行内部建模，形成一套完整的学习方案，并对此方案进行资源调度，进而反馈给学习者所需的资源信息。“学习者个人秘书”也就是所谓的个性化处理引擎，它主要由四个模块组成：用户信息收集、用户信息建模、个性化学习方案、学习资源调度。该个性化学习系统方案构建如图2所示。

⑴ 用户信息收集模块

信息收集模块是实现在线学习个性化服务的基础，它收集用户请求，跟踪用户的行为，结合用户数据库中事先存放的用户个性化特征数据，经过预处理，对用户信息建模提供个性化的策略。

⑵ 用户信息建模模块

信息建模模块则是运用数据挖掘技术对这些信息进行分析，不断更新或者初始化用户数据库中动态部分，以生成个性化推荐策略并发送给个性化学习方案模块。

⑶ 个性化学习方案模块

学习方案模块是“学习者个人秘书”的核心模块，它结合前面提供的一系列用户特征信息，并进行整合后自动生成一套教学方案，把教学方案中所需要调度的资源传递给资源调度模块。

⑷ 资源调度模块

资源调度模块是根据教学方案中需要调度的资源从视频库、作业库、试题库等资源库中调度并反馈给用户。其中，资源库中保存学习者的基本信息、学习历史、访问历史、对知识的掌握情况、学习喜好等个性特征。学生的个性特征也分为静态信息与动态信息。如学生的姓名、性别、年龄、ID、密码等都属于静态信息，如学习历史、学生做过的练习和测试题的答案、学习者的知识结构等都属于动态信息。学生的个性化特征信息是实施个性化教学策略的基础。

总之，整个个性化在线学习系统就是通过数据挖掘技术，把用户在学习过程的所有行为记录下来，并结合用户数据库，从中挖掘出用户个性化学习特征，为个性化教学策略的产生提供可靠的依据。在本文，学习者个人秘书个性化引擎的加入，主要是实现个性化学习系统中视频主导、测验穿插、在线交流、引导学习等功能。其中视频能提取该集视频所具有的知识点，作为关键字在知识树中进行串联。知识树是惟一呈现给用户的学习接口，让用户不再注重于选择何种视频、哪位老师所教，达到最快的学习效率。再就是测验穿插，是在用户不主动去做测验的时候，类似强制于用户做测验，否则无法进入下阶段测试。概括来说，学习者个人秘书模型设计实现以下功能：记录学习者进行的所有学习活动；定时给予用户学习建议与误区纠正；能主动与其他学习者的学习秘书进行交流；记录每次学习周期，学习者的学习路线。

2.2 Web数据挖掘在系统中的应用

数据挖掘是开发Web智能的学习系统的关键所在，它对个性化学习模型的构建、个性化的学习资源的提供、个性化学习的指导、系统性能的改进等方面应用非常多。

⑴ 个性化学习模型的构建

学习者模型的构建本就是根据学习者不同的个性特征参数，对学生学习活动进行跟踪，并且记录学生学习的相关信息，如：学生经常访问的URL的次数、停留时间、访问的课程数等等。Web数据挖掘用去噪和模式进行“模式发现”，得到学生学习的个性特征，建立、完善学生学习模型，建立学生个性数据库，为不同的学生提供智能、个性的学习策略。

⑵ 个性化学习资源的提供

在系统进行模式发现后，需要为学生从后台数据库中调度学习资源，这时候就需要系统将学生无关及学生不感兴趣的资源进行筛选。Web数据挖掘中的统计分析技术可以根据学生经常访问的页面推测学生下一步的行为，推测出其感兴趣的相关资源，从而减少学生的搜索时间，合理提供备用资源。

⑶ 个性化学习的指导

一个好的学习系统能适应的并不只是一类人，而是不同背景，不同能力，不同目的的人，因为每个人的学习能力、兴趣、习惯以及基础都有很大的差异。若采取进入系统平台前让用户提交测试用户属性信息的一些表单，初始化学生学习特征，但是其中的属性却是时刻变动的，普通的学习系统无法做到随机应变。利用Web数据挖掘技术，挖掘用户的使用数据日志，分析用户的浏览趋势，从而形成一组按时间排序的会话，预测用户未来的访问模式并做及时的指导。这样针对不同类型的用户，系统可以安排特定的内容，做到真正意义上的“因材施教”。

⑷ 系统性能的改进

Web数据挖掘技术提供网站构架及用户的使用信息，管理员可以根据这些信息，控制Web缓存、负载平衡和网络构架等问题，从而做到了系统的安全性与稳定性。

3 结束语

基于Web数据挖掘的个性化学习系统研究，以“个性化E-learning系统研究与实现”课题为背景，实现了Web数据挖掘技术的应用、学习知识点概念相关性的算法分析与设计、且构建一个基于Web的学习者模型，阐述系统研究思路，并完成了系统设计与实现应用。在一定基础上为在线学习系统的个性化应用提供理论与推广参考价值。同时，本文虽取得了具体的应用效果，但在个性化学习资源的组织与动态呈现上未能与学习者模型联系，以呈现针对不同用户的个性化学习内容页面。这将是今后需要进一步研究的问题。

参考文献：

[1] 陶剑文.基于多Agent的协作式网络学习系统模型研究[J].计算机时代，2006.7：64-66

[2] 单蓉.一种基于用户浏览行为更新的兴趣模型[J].电子设计工程，20l0.4：61-62

[3 唐远洋，黄尔嘉.知识挖掘技术与网络教育资源的组织[J]. 情报资料工作，2005.4：107-109

[4] 游文，叶水生.电子商务推荐系统中的协同过滤推荐[J].计算机技术与发展，2006.9：97-99

[5] 邱明虹，何跃.从Web日志中挖掘用户兴趣路径算法改进[J].计算机工程与应用，2008.26：129-131

[6] 马宏伟，张光卫，.协同过滤推荐算法综述[J].小型微型计算机系统，2009.7：1682-1687

[7] 朱明.数据挖掘[M].中国科学技术大学出版社，2008.

基于Web数据挖掘的个性化学习系统研究

文档上传者

热门推荐更多>

精品范文更多>

基于Web数据挖掘的个性化学习系统研究

文档上传者

热门推荐 更多>

精品范文更多>

热门推荐更多>