分层式学生信息数据管理的探讨

时间:2022-09-17 08:22:28

分层式学生信息数据管理的探讨

开放大学主要面对成人教育,在学生管理上,成人高校与普通高校有很大不同,提供的功能也随着大数据云服务等的要求,管理信息相对来说更为复杂。本文针对大量的成人学生信息,提出一种分层式数据仓库的模式,这种开放式的数据管理模式为后续分布式计算,挖据、云服务等提供了开放的接口和支撑。

【关键词】信息管理系统 大数据库 分层架构

上海开放大学主要面对成人教育,近年来每年注册学生近十万。成人培养与普通高校教育在管理上有很大不同,学籍有效期为8年而非4年,允许每个学习者根据自己的工作、生活和学习情况,在学籍有效期内调整个性化学习进度。这样一来,同时入学同个专业的人,不像普通高校那样班级固定、每学期学习科目固定、毕业时间固定,而是可能每学期完成的课程不同,上课的班级也不同,毕业时间也可能不同。另外,当前信息的快速发展,也对数据的服务提出更高的要求,因此,对成人学生的信息管理相对来说更为复杂。

学生信息管理系统可以对学生成绩信息进行集中、有序、有效的管理,更新方便快捷、单元数据重组灵活,降低劳动强度。因为历史原因,当前所使用的历史数据分别存在于不同的独立子应用中,数据结构互不兼容,需要接口将其对接,开发有效的学生信息管理系统迫在眉睫。

1 学生信息管理系统基本功能分析

开放大学学生信息管理系统是为完成大量成人学生相关信息处理而开发的管理软件,主要用于学校学生信息管理,总体任务是实现学生信息关系的系统化、科学化、规范化和自动化。学生信息管理系统是远程学习平台中的重要组成部分,是远程教学的辅助平台。

学生信息管理系统主要任务是用计算机对学生各种信息,包括基本信息、学习进度、选课情况、学习成绩、班级信息等进行日常管理,如查询、修改、增加、删除等基本操作。从数据流动角度看,学生信息管理系统大体上分为后台的数据处理和前台的应用显示两个部分。本系统的数据信息极为复杂,主要原因如下:首先学生人数多,近年来每年的注册学生近十万,每个学生的学籍比普通高校更长,班级变化频繁,数据维护复杂;其次历史信息数据分别存在于不同的系统中,这些小系统往往互不兼容,数据无法直接交接,需要强的数据兼容能力和开发有效的转换接口;最后,学生信息系统的数据保存期要求时间长,要求常规数据处理功能外,还要求具有深层次数据挖掘能力。这要求建立多层数据仓库,才能满足资信业务对数据的处理要求。经开发小组前期调查后,本系统基于SQLServer 数据库开发工具进行设计。

2 四层式学生信息大数据库

SQLServer 数据库开发工具提供数据仓库开发工具。数据仓库子系统(DWS)由数据集市(数据仓库DW)、仓库管理(DBMS)和分析工具三部分组成。数据仓库是存储数据的一种组织形式,它从传统中获得原始数据,先按辅助决策的主题要求形成当前基本数据层,再按综合决策的要求形成综合数据层。临时数据以及中间数据都暂存在数据缓存区当中,对数据源进行抽取、过滤、转换、映射经过处理后放入数据仓库。数据仓库的模型以元数据的形式存储于该仓库中,它定义了数据仓库的结构和内容。用于OLAP服务器能加强和规范决策支持的服务工作,集中和简化原客户端和DW服务器的部分工作,降低系统数据传输量,因此工作效率更高。

教学信息数据仓库采用四层结构:基础数据层、初级汇总层、高级汇总层、查询层。基础数据层用来存放学生信息最低粒度的数据表集合,例如“学生个人基本信息”这样的基本数据,具体包括了ODS(Operational Data Store)模型、逻辑数据模型、外来数据、业务元数据等。它是其它三层的数据来源。

初级汇总层是将基础数据层中的数据按照某些业务规则进行初步汇总,以供给查询层、高级汇总层使用。它按照主题和业务目标进行初步的数据组织,可以给查询层的简单查询、简单报表输出等提供服务,也为高级汇总层提供数据基础。本层具体包括数学方法模型库、专家知识库、基础模型库和数量工具库。基础模型库根据判断评级质量、从历史评级数据积累得出的量化分析资源,包括合格率、失学率、专业风险系数等,它是应用模型的基础。数量工具库存放于模型有关的基础算法和统计方法,包括相关分析和回归分析、时间序列分析、聚类分析法等基本方法模型。

高级汇总层也是以主题和业务目标进行数据组织的,在初级汇总层的基础上,对数据进行深层次的挖掘,包括数据挖掘规则库和应用模型库。应用模型库针对基本业务的基本规则,包括学生注册、个人学习计划制定等基本的数据组织规则模型。

基础模型库、应用模型库以及应用模型库组成学生信息管理系统的模型库,针对各种教学及辅助业务来完成相应模型的建立、维护和运算等处理。它们是数据仓库的核心,为终端展示提供可靠高效的数据服务。

3 结束语

现有的学生信息管理系统是原电视大学学生信息中直接引用过来的,数据兼容性小、功能单一、实时性较差。涉及的独立数据庞大,除了需要分析处理大量的历史数据,还要对原有独立小系统的数据进行清洗、整合、分析等操作。为解决这一问题,本文提出一种分层式学生信息管理系统,提出一种分层式数据仓库的模式,这种开放式的数据管理模式为后续分布式计算,挖据、云服务等提供了开放的接口和支撑。

参考文献

[1]余宗民,刘义宁,祈国辉.数据仓库项目管理实践[M].北京:人民邮电出版社,2006.

[2]崔杰,李陶深.基于Hadoop的海量数据存储平台设计与开发[J].计算机研究与发展,2012(49).

[3]肖飞,齐立磊.大数据处理技术与探索[J].计算机与现代化,2013(09).

[4]杨平乐,刘树森.基于学生信息管理系统的设计与实现[J].计算机技术与发展,2010(05).

作者单位

上海开放大学 信息与工程学院 上海市 200433

上一篇:构建实时电力数据仓库的关键技术探析 下一篇:基于Mondrian平台的邮政金融数据挖掘应用