关于大数据应用于教育的思考

时间:2022-10-19 11:42:26

关于大数据应用于教育的思考

摘要:大数据能够真实地撷取、存储和处理规模巨大的有效信息,因此在商业服务、公共卫生等领域备受瞩目。而面对愈加不能满足当今需求的传统教育,大数据的发展使得教育面临一场新的变革。分析了教育领域中大数据的产生背景,介绍了国内外一些教育大数据的实践,提出了现阶段教育大数据面临的若干问题和挑战。

关键词:大数据;数据挖掘;个性化教育

作者简介:张燕南(1980-),女,河北唐山人,第二军医大学基础部外语教研室,讲师;胡继岳(1965-),女,江苏阜宁人,第二军医大学基础部外语教研室主任,教授。(上海 200433)

中图分类号:G640 文献标识码:A 文章编号:1007-0079(2013)32-0005-03

我国各种教育机构每年投入大量资源用于网络课程的建设,然而许多课程网站不过是课堂搬家和材料罗列,将网络课程建成了网络教材,难以调动学生群体的学习热情和主动性。建立大型学习资源库本身并不能改变学习,真正有巨大价值的是在学习过程中的每一个学习行为所表达的意义,当前大力发展的教育信息化公共服务平台和数字化校园建设,如果缺乏对数据的深度挖掘和专业分析,同样也只能流于形式。大数据能够将这些行为进行整合和处理,揭示背后隐藏的价值,指引一系列变革举措,如教育环境的设计、教育实验场景的布置、教育时空的配置、学习场景的完善、教育管理数据的采集和决策等。随着计算机硬件的高速革新和软件的高度智能化进程,大数据这一蓬勃发展的新生事物必将掀起一轮崭新的教育信息化浪潮。

一、大数据概况

1.大数据的涵义

大数据(big data)或称巨量资料,其概念来源于最早经历信息爆炸的学科,如天文学、物理学和生物学等,用于描述目标数据量的规模远远超出了一般电脑处理能力的情形。现今各行各业的每个领域都面对着数据量的爆发式增长,据研究预测,人类存储信息量的增长速度比世界经济的增长速度快4倍;截至2013年,世界上存储的数据预计能达到约1.2ZB,其中98%都是数字数据。[1]

为解决数据急剧扩张引发的技术瓶颈问题,技术研究人员致力于开发和改进数据处理技术与工具,如基于云技术的大型数据集分析框架MapReduce和分布式系统基础平台Hadoop等,大大增加了可处理的数据量。大数据的涵义也随之发生了变化,不仅用于描述需要进行批量处理或分析的大量数据集,还同时涵盖了处理数据的速度。

美国互联网数据中心将大数据定义为:通过高速捕捉、发现和/或分析,从大容量数据中获取价值的一种新的技术架构。[2]进而概括为四个英文字母V:更大的容量(Volume)、更高的多样性(Variety)、更快的生成速度(Velocity),以及由前面三个“V”组合推动的第四个因素——价值(Value),即对大数据的掌握程度可转化为经济价值的来源。

2.大数据的应用

2011年5月,麦肯锡全球研究院发表了一篇题为《大数据:创新、竞争和生产力的下一个新领域》的报告。[3]该报告主要提出了两个观点:一是数据已经渗透到每一个行业、每一个业务职能领域;二是海量数据的应用意味着下一波或者新一轮生产率的增长和消费者盈余浪潮的到来。

支付宝自2011年起“年度个人对账单”。每个用户都能通过个人年度对账单看到自己一年来详细的网上支出状况,包括购物类别、每月支出、消费排行,以及对用户的购物习惯和消费态度的分析。在亚马逊和京东商城等网站购物时会得到个性化的商品推荐,这就是通过数据挖掘技术追踪和发现用户的行为习惯与喜好,从凌乱纷繁的数据背后找到更符合用户兴趣和习惯的产品与服务,从而实现对产品和服务的调整与优化。

2009年,谷歌的工程师在《自然》杂志上发表了一篇论文,成功预测了甲型H1N1流感在美国的爆发和传播,并且具体到特定的州和地区。[4]与公共卫生机构相对滞后的官方数据相比,谷歌通过观察和分析来自用户的海量网上搜索记录,了更为有效和及时的预测。基于大数据时代的数据储备和技术理念,能够实现以前所未有的方式洞见事物的发展趋势。

上述事例表明,大数据不仅能够成为经济价值的来源,其中也潜在大量的科学价值和社会价值,经济学、政治学、社会学和许多科学门类都会发生巨大甚至本质上的变化与发展,进而影响人们的价值体系、知识体系和生活方式,教育学科和教育领域的研究也必然在此之列。

二、教育领域中的大数据

1.教育大数据的产生背景

(1)MOOC的蓬勃发展。2006年,萨尔曼·可汗(Salman Khan)创办了利用在线视频进行免费授课的可汗学院,现有关于数学、历史、金融、物理、化学、生物、天文学等科目的3400多段视频,注册用户超过了1000万人。2011年,斯坦福大学的一门人工智能网上课程吸引了190多个国家的16万名学生参加学习,该课程的讲授者塞巴斯蒂安·特伦(Sebastian Thrun)教授创办了在线教育网站Udacity。2012年,盈利性在线大学教育平台Coursera上线,和普林斯顿大学、斯坦福大学、密歇根大学和宾夕法尼亚大学等83所大学协同提供课程,目前在全球拥有380万的注册用户。同年,哈佛大学与麻省理工学院宣布结成非营利性合作伙伴关系,联合发起了名为“edX”的网上课程系统,联手提供免费的在线课程,搭建共同教育平台,包括清华大学、北京大学在内的其他26所全球名校也相继加入了这一平台。

MOOC是Massive(大规模的)、Open(开放的)、Online(在线的)、Course(课程)四个英文单词的首字缩写,意为大规模网络开放课程。互联网技术的发展带动了教育的网络化和国际化,MOOC更将传统的远程教育推向了新的高度和广度,催动了网络学习时代的到来。在教育活动中,相对于通过师生面对面的接触获取教育数据的途径而言,基于大型网络课程平台进行数据挖掘的方式显然有效得多:学习行为的数据将自动留存,更易于后期的学习行为评价和评估;教师只需通过分析整合学习行为就能得到学习过程中的规律;利用数据挖掘的关联分析和演变分析等功能,在学生管理数据库中挖掘有价值的数据,分析学生的日常行为,可得知各种行为活动之间的内在联系,并提出相应的对策。

(2)社会科学研究方法的局限。在信息处理能力受限的时代,研究人员需要处理数据以解释未知世界的规律,却缺乏用于收集和分析数据的技术工具。在云计算等互联网技术高速发展的今天,感应器、手机导航、网站点击产生的大量数据可以被轻易获取,而且计算机也具有高速甚至实时处理这些数据的能力,那些属于工业时代的一系列问题已不再难以解决。社会科学,不论是社会学、心理学、经济学还是教育学,过去都曾非常依赖通过问卷调查法进行样本分析,甚至在无法获得实证数据时纯粹依赖假设、经验去尝试解释未知领域的规律。大数据时代的来临,使得社会科学研究者能够在更多的领域和更深的层次中获得与使用全面数据和完整数据,从而实现从演绎到归纳这一思维路径的改变。

从信息的真实性来说,社会科学领域的研究者们面临的问题是研究对象的复杂性。“人性”与“物性”不同,自然科学研究的物质世界比较稳定,因此更容易获取数据并从中寻找规律,而人的心理具有动态性和敏感性,变化多端,难以总结。传统教育数据主要通过阶段性测试或调查量表等形式进行获取,如学生整体的学业水平、身体发育与体质状况、社会性情绪及适应性的发展、对学校的满意度等,整个过程中被试者完全知情,不免会受到来自实验环境以及主试者的表情、手势、语气等变量的干扰。而大数据的收集凭借一定的观测技术与设备的辅助,在不影响学生日常学习与生活的前提下记录被试者的日常状况。可以说在大数据时代,教育研究者比任何时候都更接近真正的学生。[5]

(3)个性化教育的需求。国际个性化教育协会(International Personalization Education Association,简称IPEA)将个性化教育定义为:“为受教育者量身定制教育目标、教育计划、教育培训方法、辅导方案并加以执行,组织相关专业人员为受教育者提供学习管理策略和知识管理技术以及整合有效的教育资源,帮助受教育者突破生存限制,实现自我成长、自我实现和自我超越。”[6]为学生构建个性化教育环境,根据学生的实际学习步调和学习情况开展有针对性的学习指导,使其真正融入学习过程中,这就需要对学生已有的学习准备、能力、兴趣和天分、学习风格等加以评估,这在信息获取手段匮乏的传统数据时代极难实现。

目前,美国的一些高校正在利用大数据进行个性化教育实践:亚利桑那州立大学通过在线课程为学生提供个性化学习体验。学校使用Facebook应用程序挖掘学生的个人页面数据,根据学生的兴趣点为其推荐志同道合的朋友;另一程序可跟踪学生使用校园卡的时间和地点,分析学生是否参与到了学习中。里奥萨拉多学院利用数据分析软件预测学生在课堂上的表现,并把学习报告发送给教授,以帮助学生改进学习方法。

学生在学习和生活的过程中留下一串数字足迹碎片,如在线学习和网络社交行为、校园卡的使用等。当这些数据被整合、挖掘和分析时,学习者的行为模式则会得以揭示。大数据的到来,使得教育研究领域能够藉由前沿技术的发展从宏观群体走向微观个体,跟踪每一个学习者的数据不再困难,从而实现了真正意义上的、全面细致的个性化教育。

2.教育大数据的运作

达雷尔·M·韦斯特(Darrell M. West)指出,数据挖掘、数据分析和在线决策面板是利用大数据进行教育研究和评价的三大要素。[7]

数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息过程。教育领域的数据挖掘关注于开发新的工具和算法、发掘数据模式,侧重于以合理、快速的方法从教育数据库中发现相关信息和知识。

数据分析是指用适当的统计方法对收集来的大量的第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能、发挥数据的作用。教育领域的数据分析聚焦于在教学系统中更广泛地应用工具和技术。

在线决策面板是在线内容管理系统的控制页面,其功能是以简洁、直观的图表和数字展现数据分析的结果。通常需要采取紧急应对措施的项目会标示在页面的明显位置,而不太重要的统计数据则被下移到页面底部,方便教师检视学生当前的学习情况。

基于数据挖掘、数据分析和在线决策面板三大要素的教育大数据运作流程具体可划分为六个步骤,如图1所示。[8]一是学生使用在线系统进行学习;二是系统收集和记录学生的在线学习行为,存入数据库;三是进行数据分析和处理、预测学生的学业表现;四是对预测和反馈结果进行可视化处理;五是提供适合学生个人的学习材料;六是教师、管理人员和开发人员适时给予学生指导和帮助。

3.大数据的教育实践

(1)个性化课程分析。佛罗里达州立大学利用eAdvisor程序为学生推荐课程和跟踪其课业表现。奥斯汀佩伊州立大学的“学位罗盘(Degree Compass)”系统在学生注册课程前,通过机器人顾问评估个人情况,并向其推荐他们可能取得优秀学业表现的课程。系统首先获取某个学生以前(高中或大学)的学业表现,然后从已毕业学生的成绩库中找到与之成绩相似的学生,分析以前的成绩和待选课程表现之间的相关性、结合某专业的要求和学生能够完成的课程进行分析、利用这些信息预测学生未来在课程中可能取得的成绩,最后综合考量预测的学生成绩和各门课程的重要性,为学生推荐一个专业课程的清单。

(2)辍学行为的预测。美国西部州际高等教育委员会(Western Interstate Commission for Higher Education,简称WICHE)以凤凰城大学和里奥萨拉多学院等6所学校的64万名学生为对象,建立了一个教育数据库。该数据库可以记录3百万条课程信息,进行33个针对在线课程的变量分析。当一些与辍学行为有关的关键因素(如旷课、纪律问题、课堂表现)发生变化时,系统会向校方发出预警。里奥萨拉多学院有43000名接受在线学习的学生,学院的预警系统允许教师看到代表学生行为的红、黄、绿色指示灯,并根据学生的在线互动行为评估其表现,如阅读教科书和回应教师要求的频率。

(3)助学需求的预测。华东师范大学的“家庭经济困难学生预警系统”通过收集校园卡的记录进行分析测算,向可能存在经济困难的学生发送询问短信。系统具体的做法是:跟踪学生的校园卡,对全校本科生周一到周四的中、晚餐消费值进行统计,分别计算出男女同学的平均消费值,乘以0.6的系数,得出预警消费线。如经系统筛选发现就餐消费明显偏低,学校勤工助学中心在对比分析学生入学时填写的资料后,会主动向学生发出短信以征询情况,同时也会通过院系教师做进一步了解,以判定学生是否真的面临家庭困难,需要帮助。

(4)学术研究趋势的把握。斯坦福大学的文学实验室正在进行一项研究,尝试以通过谷歌图书计划放置在互联网上的海量书籍为平台,进行数据挖掘和分析,把握和预测文学作品和学术研究的发展趋势。斯坦福的英语教授马修·L·乔卡斯(Matthew L. Jockers)在一堂课上布置了内容涵盖1200篇小说的作业。学生要完成的并不是逐篇阅读,而是通过计算机程序来研究文学风格、观点、语言和文化的演变。人文学科,无论是历史、文学还是语言研究,只要是聚焦于书本的,都可以用这个思维来进行研究。

(5)其他实践。美国的房产网站TRULIA将房产信息、税收信息、犯罪信息、学区信息、学校政府评价、社会评论集成在一起,美国几乎任何一个学校和学区的情况都可以在这一数据基础上通过可视化技术直观地展现在人们眼前;有研究指出,[9]教育大数据还可以用于分析合作学习小组中的强、弱方,促进学习任务的合理分配;教育机构还能从大数据中看到是否将教育款项恰当地拨到了需要的地方。

4.教育大数据面临的挑战

尽管大数据开启了重要的时代转型,推动着教育理念的变革,但同时也伴随着不少问题和挑战。

首先,关于人才和技能。有效利用大数据,需要来自数学、统计学或计算机工程等领域的众多专业人员,如管理硬件部件的系统管理员、搭建平台的程序开发人员、运用算法解决问题的数据分析员、收集高质量数据的数据专员等等,因此人才的募集和培训存在较大困难。

其次,隐私和伦理的问题。大数据时代的个性化服务是建立在对行为的追踪和分析的基础上的,这意味着会在某种程度上触及到个人无意公之于众的隐私信息。此类信息的所有权和使用权的归属并不明确,数据可能遭到滥用。

再次,数据主宰一切的隐忧。为了追求更好的成绩而基于学生以往的学业表现为其推荐课程,有可能导致学生只学习过于简单的课程,不利于其挑战性和积极性的激发,学生也有可能被迫放弃梦想转修一些实用课程。

最后,研究方法的不成熟。大数据研究目前还没有形成清晰的方法和路径,同时也缺乏统一的标准,每个教育机构都可能采用不同的运作形式。

三、结语

总而言之,大数据在教育领域的应用惠及以下相关人员:学生是其中最大的受益方,如上所述,每一个学生都有机会获得为自己量身定做的教学活动和资源;家长得以通过崭新的视角掌握全面、真实的教育信息;教师则从中获取对教学的客观反馈、对课程内容和学习过程进行评价、挖掘学生的学习模式、改进个性化教学的手段;教育管理者能够更好地组织教育资源、制定教育改革的方向和措施;教育研究者能够借此转变思路,开拓新的研究思维和路径。尽管大数据为教育带来了巨大的启发和机遇,但是作为新鲜事物,许多与之相关的研究仍处于探索和尝试阶段,有待于在实践过程中不断完善。

参考文献:

[1]维克托·迈尔-舍恩伯格.大数据时代[M].盛杨燕,等,译.杭州:浙江人民出版社,2013.

[2]John Gantz &David Reinsel.Extracting Value from Chaos [EB/OL].http:///collateral/analyst-reports/idc-extracting-value-from-chaos-ar.pdf.

[3]James Manyika.Big data:The next frontier for innovation,competition,

and productivity[EB/OL].http:///insights/business_technology/big_data_the_next_frontier_for_innovation.

[4]Jer.Open Science,H1N1,Processing,and the Google Spreadsheet API[EB/OL].http:///blog/blprnt/open-science-h1n1-processing-and-the-google-spreadsheet-api.

[5]张韫.大数据带给教育的机遇与挑战[EB/OL].http:///Age06.Web/Detail.aspx?InfoGuid=ec46cae7-e39b-4da1-ae0f-980fe4d68929.

[6]杨妮.美国高中个性化教育策略及其启示[J].教育导刊,2013,(1).

[7]Darrell M.West.Big Data for Education:Data Mining,Data Analytics,and Web Dashboards[EB/OL].http://www.brookings.edu/~/media/

research/files/papers/2012/9/04%20education%20technology%20west/04%20education%20technology%20west.pdf.

[8]COLLEGESTATS.How Can Data Mining & Analytics Enhance Education?[EB/OL].http:///articles/2013/01/how-can-data-mining-analytics-enhance-education/.

[9]Kim Rose.Big data’s potential for higher education[EB/OL].http:///blog/big-datas-potential-for-higher-education/.

上一篇:现实困境下专业学位教育的制度构建与路径选择... 下一篇:行业特色高校产学研合作现状、问题与对策分析