基于网络的动态数据分析系统的建设与探析

时间:2022-08-23 12:22:30

基于网络的动态数据分析系统的建设与探析

摘 要:高职院校人才培养工作状态采集平台中采集的数据随着应用的不断推广,数据量逐年递增,对数据分析的工作越来越重要。为实现全省状态采集平台数据的统一管理和共享,建设了基于网络的动态数据分析系统,利用网络存储的优势,扩充数据分析的功能,辅助各高职院校以及省级教育部门完善教学质量保障体系。

关键词:状态采集平台;数据分析;图表

中图分类号:G717 文献标识码:A

1 网络版高职院校状态采集平台动态数据分析系

统建设的必要性

为促进高职院校发展的需要,实现学校管理的科学化、现代化、规范化,提高人才培养质量,江苏省自2008年开始推进《高等职业院校人才培养工作状态采集平台》系统的应用,每年采集一次数据。目前,高职院校的数据采集平台是由上海行健职业技术学院开发的单机版[1],近两年推出了网络版的采集平台,但网络版只有数据采集的功能,没有开发数据分析的功能。

目前状态采集平台的数据分析系统使用的是江苏经贸学院开发的单机版数据分析系统。该系统将全省80多所高职院校的统计数据整合起来,进行分析处理,以人们最能接受的直观的图表方式来呈现。界面简洁,功能相对齐全。但单机版的数据分析系统因为受到各种条件的限制,存在一些缺点。

(1)自动化程度低。单机版数据分析系统的统计数据需要从每个院校的excel表格中获取,获取数据的自动化程度低。各个院校提交到省教育部门的是一个excel文档,其中包括原始数据和统计数据。数据的获取必须将80多个excel文档中的统计数据项提取到一个新的excel文档中,然后通过数据分析系统将这些统计数据以图表的方式呈现。在数据提取的过程中,需要人为干预,耗费大量的时间和精力,容易出现错误。

(2)缺乏状态采集数据的纵向比较。单机版的数据分析系统处理的都是单个年份的数据,只能对各个院校的数据进行横向比较,而无法实现每个高校数据的纵向比较。而对于用户来说,数据分析不仅需要在各个院校之间进行横向的比较,同时也需要纵向比较。在本系统中,增加了纵向比较功能,通过对历年的数据对比分析,以折线图的表现方式直观表现数据的变化,根据图表对未来数据项进行预测。

(3)无法实现资源的统一管理和共享。状态采集平台目前收集了高职院校的大量数据,这些原始数据作为全社会一个公共的教育资源,应该进行统一管理和共享,不仅为教育部门和高职院校提供决策支持,同时让更多的人参与了解高职院校的办学情况、专业状况等,进一步加强舆论监督的力量。在信息化的今天,资源的统一管理和共享显得尤为重要。

随着状态采集平台在全省院校中的应用推广,其作用不仅仅是为了采集数据,更为重要的是对采集到的数据进行统计分析。随着数据量逐年递增,数据分析的重要性越来越突显,分析结果将更具有参考价值。在此情况下,将一些杂乱的大量的没有规律的数据转换为有价值的决策信息,辅助各高职院校以及省级教育部门完善教学质量保障体系。因此建设网络版的省级数据分析系统势在必行。

2 省级状态采集平台数据分析系统的设计

为了增强系统的健壮性,本系统在设计中将状态采集平台的原数据与统计汇总的数据完全分开,一方面使得数据相对独立,另一方面则保证数据分析系统的运行速度。系统的设计框架如图1所示。

图1 系统框架

状态采集平台的数据项以及状态采集平台整个系统还在不断地完善中,每年的数据项、数据的名称等会发生变化,比如数据库表的字段名称会发生变化,数据表会增加,以及数据库中表的名称会发生变化等等。在2013年状态采集平台中,数据项“学校代码”修改为“学校标识码”,“院校名称”改为“学校名称”,“应届毕业生顶岗实习情况的毕业生录用比例(%)”改为“企业录用率(%)”,类似这样的变化的数据项有很多。状态采集平台这些数据项的变化必然会导致数据统计系统的变化。为了使数据分析系统具有稳定性和健壮性,在系统的设计中,我们将统计和分析作为两个独立的系统,数据统计系统的主要功能就是根据数据分析系统中的需要分析的数据项进行统计,将统计结果写入数据分析数据库。数据分析系统则相对独立,根据数据库中的数据对各项指标和数据进行对比分析。

系统的设计具有松耦合性,无论状态采集平台中的数据项如何变化,数据统计系统会将所需要的统计数据导入数据分析系统的数据库中,数据分析系统就负责将统计数据对比分析,以可视化的图表方式呈现给用户。

3 数据准备

3.1 数据来源

收集的数据是否准确,是否真实和充分,决定数据分析的直接结果。省级状态采集平台的数据分析系统作为状态采集平台系统的延续,所使用的数据均来自各高职院校通过单机版或者网络版状态采集平台填报的数据。状态采集平台经过近几年的使用,各高职院校目前都能够熟练使用,并且各级部门和领导也很重视,保证了采集数据的相对准确,从而使得数据分析结果在一定程度上正确反映学校在教育教学等方面的现状和不足,有利于针对性整改,提高教学质量。

3.2 数据选择

高等职业院校状态采集平台中采集的数据非常多,其中包括学校的硬件设施、固定资产、产学合作、招生、就业、经费收入支出、校内专任教师、兼课教师、专业状况、实习实训、学生奖助学情况、学生社团等大概80多个数据表。在实际的数据分析中,不是要对所有的数据全部进行分析,本系统选择一些对能够反映高职院校教学质量情况的数据项进行数据分析。状态采集平台数据分析系统对院校概况、办学条件、监测分析、师资概况等11个大类的数据进行分析。在每个类中都包含了很多的数据项。例如监测分析中包括了高级职称教师占专任教师的比例,生均占地面积,生均宿舍面积等7个数据项。

3.3 数据处理

高职院校状态采集平台虽然具有数据位的校验,数据格式,关联数据校验,报错和提示功能,但是在实际的采集操作过程中,仍然存在不符合规格的数据,因此就需要对数据进行各种处理。数据处理的过程分以下几个步骤:

(1)清理数据

主要清理的数据有两种:不符合格式要求的数据;奇异数据。

不符合格式要求的数据:状态采集平台中采集的数据有的在数据格式中没有限制,比如在收集教师基本信息的表中,有一项是在企业中的时间,有的学校职工在填写中就写了1天,有的写的是1*60,这样的数据格式在统计中是无法进行数学统计,必须对数据进行清理。

奇异数据:所谓奇异数据,是指在采集的过程中,针对同一类数据,个别院校的数据与其他的数据差别很大,一般我们认为相差三个数量级别时,就认为这是个奇异数据,要对其进行核准、处理,从而保证数据分析结果的准确性。

(2)转换数据格式

状态采集平台数据表中的字段基本都是字符型的数据,在数据分析系统中,对数据的统计汇总要通过数学公式来进行计算,字符型的字段无法计算,因此在数据清理完成后,必须将统计汇总的字段转换为数值型。具体的处理方法,用JAVA语言写一个批处理程序,实现对数据字段的批量转换。

(3)数据统计

在将数据准备好之后,就要对选择的数据进行统计汇总。本系统中对数据的统计一般包括总和,均值,百分比等。比如在校生人数,需要统计全省在校生总数和全省在校生均值;高级职称教师占校内专任教师,需要统计的是百分比;院校招生中的实际录取率,实际报到率等,统计的是百分比。数据统计由数据统计系统来完成。

4 系统的数据分析

状态采集平台数据分析系统主要采取图表对比分析的方法。采用图表方式的优点,易于阅读,易于理解,直观。例如各个学校的数据与全省均值的比较,各种类别院校的均值比较,历年数据的对比分析。对比分析主要通过以下几种图表实现:

(1)仪表盘形式。这种仪表盘的对比方式主要适合于各个院校数据与全省均值的对比,仪表盘显示院校的指标数据,全省均值则显示在仪表盘的上方,这样便于两个数值的比较。同时数据分析系统还显示了各院校数据在全省的排名。图2是某个院校的教师数、全省排名以及与全省均值的比较。

图2 仪表盘数据对比分析

(2)柱状图形式。柱状图的图表形式也是我们最常用的一种对比方法。在本系统中主要用于数据各种均值的比较。例如,全省均值,国家示范院校均值,国家骨干院校均值,省级师范院校均值,一般院校均值,综合师范民族类均值等。图3是校内专任教师数量的均值比较。

图3 柱状图数据对比分析

(3)折线图对比形式。数据分析系统中纵向数据的比较适合用折线图对比形式,表现简洁,便于理解,能够明显看出数据项在几年中的变化,从而指导学校的进行科学话管理和决策。由于网络版数据分析系统今年才开始推广,数据项是从2012年开始的,目前折线图的对比方式还没有完全体现出来。

5 结束语

状态采集平台数据分析系统的建设,为省级教育部门的决策咨询提供详实有力的数据,有利于科学合理的制定宏观调控政策,强化宏观管理和指导的针对性,进一步推进高等职业教育的可持续发展;有利于各高职院校查找办学差距和薄弱环节,整合教学资源配置,提高办学治校的科学化水平,不断加强和改善自身的教育教学管理。

参考文献

[1] 陈方辉.高等职业院校人才培养工作状态数据采集平台研究

[J].安徽电子信息职业技术学院学报,2012(1).

[2] 李畅,陈方辉.高等职业院校人才培养工作状态数据采集平台

指标分析[J].江苏经贸职业技术学院学报,2011(6),79-81.

[3] 李果,等.知识管理视角下高职人才培养工作状态数据采集平

台的建设与实施[J].职业技术教育,2013(8):55-57.

[4] 田飞.高职院校人才培养工作状态数据采集平台分析策略研

究[J].才智,2011(36):337-338.

作者简介:

蔡会霞(1973-),女,硕士,工程师.研究领域:多媒体技术,网络

技术应用.

上一篇:基于情境学习的高职软件项目化教学探索 下一篇:“一条主线、四重循环”的教学模式在高职《数...