数据分析设计范文

时间:2023-07-24 10:48:53

数据分析设计

数据分析设计范文第1篇

关键词:商务平台;数据分析;电子商务

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)30-0211-02

随着电子商务的发展,越来越多的实体商户转向网络虚拟网店,“淘宝网”的店铺数呈指数增长;消费者也越来越疲于花大量时间在海量的信息中寻找自己需要的商品[1]。由此衍生出以团购为生存方式的电子商务平台,如“折800”、“一淘网”等依赖于“淘宝网”的团购网站。这些团购网站经过通过“淘宝网”从中获取折扣商品[2]。但折扣的商品有质量质疑,团购网站需要重视上线商品的质量数据问题,对网站上线商品进行售后监控,优胜劣汰。商务平台商品数据分析系统基于此开发。

1 商务平台商品数据分析

商务平台商品数据分析系统集数据获取、数据统计和分析,系统设计有如下考虑[3-4]:

1)商品ID号:根据上线商品的ID号直接获取商品的评论,并对评论进行等级评定;

2)评论平均分:计算评论平均分,据此可判断商品是否合格;

3)评论分分布:计算评论的合格数及其比例。

等级评定时是多个操作人员同时对同一商品数据进行评论操作,评论评分定级是人工进行的,操作人员的主观对商品评论操作有一定影响。因此需要将所有操作人员的评论评分数据进行统计对比分析,以控制整个评定的有效性。

2 系统设计

本系统根据MVC的三层框架,利用JSP技术制作动态网页,通过JDBC技术访问数据库,使用JSP作为服务器端应用程序处理客户端的请求并在Web服务器中进行业务逻辑处理并返回客户端请求的结果。在JSP里嵌套HTML以及CSS对WEB页面进行设计,引入Bootstrap封装的样式,达到系统数据呈现的设计要求[5-6]。

页面数据呈现与后台数据交互是整个系统的核心,对数据进行归纳计算和整理并呈现到用户界面上。用户只需获取到公司平台上线商品的ID号就可以通过系统抓取商品评论数据;同时对数据进行整理分析得到评论平均分、评论分数比例等数据;同时可以系统整理分析出整体上线商品的整体趋势,通过饼状图直观地看出商品的品质分布。

2.1 系统功能结构设计

商务平台商品数据分析系统分为三个模块,八个基本功能,分别是管理员登陆、用户登陆、用户注册、商品评论抓取评分、商品评论数据的统计和分析、用户管理和修改密码等,根据分析,本系统的功能结构图如图1所示。

1)管理员登陆:管理员输入用户名和密码,数据经由UI Servlet传递给Controller Servlet,再到数据库中验证身份,将结果返回给JSP,成功登陆就可进入系统,不成功则重新输入。用户名只可能是字母,密码字母和数字皆可。管理员是系统指定的,不可以注册。

2)用户登录:普通用户输入用户名和密码,数据经由UI Servlet传递给Controller Servlet,再到数据库中验证身份,将结果返回给JSP,成功登陆就可进入系统,不成功则重新输入。用户名只可能是6-20位字母,密码是6-15位字母和数字组合皆可。若没有账号,可以在用户登录JSP页面点击注册,通过UI Servlet跳转到注册页面。

3)用户注册:用户注册需要输入Email、用户名、密码等信息,Email有格式判断,必须输入正确的格式,用户名必须是6-20位字母,密码是6-15位的字母数字组合皆可。输入正确后可以成功申请新用户,随后跳转到普通用户登录界面登录系统。

4)商品评论抓取评分:普通用户与管理员皆可操作,在输入框中输入商品的id号,点击查询,就可获取到“淘宝网”中商品的前一百条评论,并且按照评论时间顺序进行呈现。其后的评分框,按照规定只能输入1-5的数值,同时点击保存,数据就会存入数据库中。

5)商品评论数据统计:此功能方便普通用户清楚的跟踪自己的工作进度,对于管理员可以掌控平台上线商品的商品质量,会显示出该操作人员所操作的所有商品的平均分、合格率,可以看出该操作人员操作的商品评分状态详情。

6)商品评论数据分析:此功能为管理者观察网站整体上线商品的质量分布,点击查询,会统计所有使用系统的普通用户操作过的所有商品数的评论数据。如此管理者可以通过这些数据对网站上线商品进行调整。以操作人为条件,区分每个人的操作数据,可以控制一定的主观误差,还有整体的上线商品的趋势。普通用户可以看出自己的主观意见和其他用户的差别。

7)用户管理:管理员可以对普通用户进行增加和删除,用户管理界面对普通用户不可见。管理员有权限重置普通用户的密码。

8)修改密码:管理员和普通用户都可以自行更改密码。

2.2 系统数据库设计

数据库能够对商务平台商品数据分析系统的后台数据进行添加、删除、查询,修改。本系统采用MySQL数据库设计,分别是用户信息表、评论评分信息表、商品数据分析表和商品数据统计表。用户信息表主要保存管理员和普通用户的登录信息:用户的用户名、密码、级别还有Email。评论评分信息表主要保存评论内容、评论的时间、评论评分、商品id、操作人员、商品名称等。商品数据分析表主要保存操作人员、操作商品总数、平均四分以上的商品总数及其比例、合格率大于80%的商品总数及其占比、合格率大于60%的商品总数及其占比、不合格商品总数及其占比等内容。商品数据统计表主要保存商品id、操作人员、商品名称、评论平均分、评论合格率、评论不合格率等信息。其设计分别见表1-表4。

3 结束语

互联网电子商务企业需要处理大量的数据。商务平台商品数据分析系统基于JAVA语言和MVC设计思想,在My Eclipse的开发环境开发,完成了淘宝商品评论数据基于商品ID号抓取、评论五等级评分、针对不同操作人员评分的合格率、平均分4分以上商品总数、合格率大于一定比例的商品总数等数据统计和分析以及用户管理等功能;商务平台商品数据分析系统前台利用Bootstrap框架和BUI框架进行开发,将后台功能进行呈现。系统操作简单,界面简洁、美观交互速度快,有效降低了商品数据分析的繁琐度提高效率。

参考文献:

[1] 谢恩宏, 石宇良. 我国城市电子商务发展特点和趋势[J]. 电子商务, 2010(10): 13-15.

[2] 许小平. 大学生网上开店品牌建设研究[J]. 中国电子商务, 2012(8): 26-29.

[3] 崔志刚. 基于电商网站商品评论数据的用户情感分析[D]. 北京: 北京交通大学, 2014.

[4] 马广松, 方宇, 徐辉. 心电网络信息系统的设计及应用[J]. 中国医疗设备, 2009(7): 55-56.

[5] 倪芳. 基于MVC的电子商务系统的设计与实现[D].厦门: 厦门大学, 2014.

数据分析设计范文第2篇

商务平台商品数据分析系统集数据获取、数据统计和分析,系统设计有如下考虑:

1)商品ID号:根据上线商品的ID号直接获取商品的评论,并对评论进行等级评定;

2)评论平均分:计算评论平均分,据此可判断商品是否合格;

3)评论分分布:计算评论的合格数及其比例。等级评定时是多个操作人员同时对同一商品数据进行评论操作,评论评分定级是人工进行的,操作人员的主观对商品评论操作有一定影响。因此需要将所有操作人员的评论评分数据进行统计对比分析,以控制整个评定的有效性。

2系统设计

本系统根据MVC的三层框架,利用JSP技术制作动态网页,通过JDBC技术访问数据库,使用JSP作为服务器端应用程序处理客户端的请求并在Web服务器中进行业务逻辑处理并返回客户端请求的结果。在JSP里嵌套HTML以及CSS对WEB页面进行设计,引入Bootstrap封装的样式,达到系统数据呈现的设计要求。页面数据呈现与后台数据交互是整个系统的核心,对数据进行归纳计算和整理并呈现到用户界面上。用户只需获取到公司平台上线商品的ID号就可以通过系统抓取商品评论数据;同时对数据进行整理分析得到评论平均分、评论分数比例等数据;同时可以系统整理分析出整体上线商品的整体趋势,通过饼状图直观地看出商品的品质分布。

2.1系统功能结构设计

商务平台商品数据分析系统分为三个模块,八个基本功能,分别是管理员登陆、用户登陆、用户注册、商品评论抓取评分、商品评论数据的统计和分析、用户管理和修改密码等。

1)管理员登陆:管理员输入用户名和密码,数据经由UIServlet传递给ControllerServlet,再到数据库中验证身份,将结果返回给JSP,成功登陆就可进入系统,不成功则重新输入。用户名只可能是字母,密码字母和数字皆可。管理员是系统指定的,不可以注册。

2)用户登录:普通用户输入用户名和密码,数据经由UIServlet传递给ControllerServlet,再到数据库中验证身份,将结果返回给JSP,成功登陆就可进入系统,不成功则重新输入。用户名只可能是6-20位字母,密码是6-15位字母和数字组合皆可。若没有账号,可以在用户登录JSP页面点击注册,通过UIServlet跳转到注册页面。

3)用户注册:用户注册需要输入Email、用户名、密码等信息,Email有格式判断,必须输入正确的格式,用户名必须是6-20位字母,密码是6-15位的字母数字组合皆可。输入正确后可以成功申请新用户,随后跳转到普通用户登录界面登录系统。

4)商品评论抓取评分:普通用户与管理员皆可操作,在输入框中输入商品的id号,点击查询,就可获取到“淘宝网”中商品的前一百条评论,并且按照评论时间顺序进行呈现。其后的评分框,按照规定只能输入1-5的数值,同时点击保存,数据就会存入数据库中。

5)商品评论数据统计:此功能方便普通用户清楚的跟踪自己的工作进度,对于管理员可以掌控平台上线商品的商品质量,会显示出该操作人员所操作的所有商品的平均分、合格率,可以看出该操作人员操作的商品评分状态详情。

6)商品评论数据分析:此功能为管理者观察网站整体上线商品的质量分布,点击查询,会统计所有使用系统的普通用户操作过的所有商品数的评论数据。如此管理者可以通过这些数据对网站上线商品进行调整。以操作人为条件,区分每个人的操作数据,可以控制一定的主观误差,还有整体的上线商品的趋势。普通用户可以看出自己的主观意见和其他用户的差别。

7)用户管理:管理员可以对普通用户进行增加和删除,用户管理界面对普通用户不可见。管理员有权限重置普通用户的密码。

8)修改密码:管理员和普通用户都可以自行更改密码。

2.2系统数据库设计

数据库能够对商务平台商品数据分析系统的后台数据进行添加、删除、查询,修改。本系统采用MySQL数据库设计,分别是用户信息表、评论评分信息表、商品数据分析表和商品数据统计表。用户信息表主要保存管理员和普通用户的登录信息:用户的用户名、密码、级别还有Email。评论评分信息表主要保存评论内容、评论的时间、评论评分、商品id、操作人员、商品名称等。商品数据分析表主要保存操作人员、操作商品总数、平均四分以上的商品总数及其比例、合格率大于80%的商品总数及其占比、合格率大于60%的商品总数及其占比、不合格商品总数及其占比等内容。商品数据统计表主要保存商品id、操作人员、商品名称、评论平均分、评论合格率、评论不合格率等信息。

3结束语

互联网电子商务企业需要处理大量的数据。商务平台商品数据分析系统基于JAVA语言和MVC设计思想,在MyEclipse的开发环境开发,完成了淘宝商品评论数据基于商品ID号抓取、评论五等级评分、针对不同操作人员评分的合格率、平均分4分以上商品总数、合格率大于一定比例的商品总数等数据统计和分析以及用户管理等功能;商务平台商品数据分析系统前台利用Bootstrap框架和BUI框架进行开发,将后台功能进行呈现。系统操作简单,界面简洁、美观交互速度快,有效降低了商品数据分析的繁琐度提高效率。

数据分析设计范文第3篇

关键词 “3414”试验;数据分析软件;设计原理

中图分类号 TP319 文献标识码 A 文章编号 1007-5739(2011)21-0043-01

Design Principle of Data Analysis Software for ‘3414’ Test

LONG Ying 1 XI Yong-shi 1 ZOU Zhong 2

(1 Agricultural Technique Extension and Service Center in Tibet Autonomous Region,Lhasa Tibet 850000; 2 Rugao Soil and Fertilizer Station in Jiangsu Province)

Abstract Data Analysis of ‘3414’ soil testing and formula fertilization test was complicated.The function,module structure and module design of ‘3414’ test data analysis software were introduced,so as to promote efficiency of data entry,regression analysis,equation analysis,etc,and to guide the production and new test design by using the analysis results.

Key words ‘3414’ test;data analysis software;design principle

“3414”试验是农业部测土配方施肥技术规范中指定的用于肥料效应函数研究的一种试验方法[1-3]。其设计包括3个因子4个水平(表1)。“3414”方案设计吸收了最优回归设计处理少、效率高的优点,是目前应用较为广泛的肥料效应田间试验方法。

自开展测土配方施肥参数试验以来,“3414”试验得到广泛的应用。随着试验的实施,试验结果的数据分析虽然有相关的专用软件支持,但试验中常出现特殊的情况,如缺区、部分重复时常给回归方程的计算带来难度,当2水平设计较偏或产量异常时,甚至会出现最高产量和推荐施肥量均为负值的现象,给数据分析与应用带来一定难度。为解决这一系列问题,应用Visaul Basic6.0研究开发了一个针对“3414”试验数据分析的软件,并在Windows XP下测试通过。为共享对“3414”的分析方法,现将该软件的设计方法介绍如下。

1 软件功能

软件的功能设计主要有2个方面:一是进行数据分析,二是反馈设计。数据分析主要是完成试验数据的回归分析,计算其回归方程,并通过方程求取最高产量和最佳经济效益时的施肥参数。反馈设计是针对本次试验设计初定的2水平与试验结果获得的最高产量或最佳经济效益时的参数水平间的差异,对下一次试验的2水平进行修正设计,以便获得更好的回归模型和肥料效应参数。

2 模块结构

软件模块主要包括数据输入、回归分析和方程应用3个部分。一是数据输入。数据输入主要包括单个试验的设计参数输入和试验结果数据的输入,还包括相同实施处理小区的多点试验数据的输入。二是回归分析。根据设计参数、回归模型和试验结果数据,运用回归运算求取回归方程。三是方程应用。本模块主要是在取得回归方程后,完成方程的试验总体评价、边际产量配方分析、最佳效益配方分析、反馈设计配方分析功能。

3 模块设计

3.1 模型生成

“3414”试验的回归分析模型是以三元二次方程(Y=b0+b1X1+b2X2+b3X3+b4X12+b5X22+b6X32+b7X1X2+b8X1X3+b9X2X3)为基础进行生成。生成方法主要分3种:一是通过内置生成标准模型,二是通过对标准模型修改生成非标模型,三是通过人机输入生成所需要的模型。

3.2 数据输入

在试验实际操作中,试验结果常非常复杂[4-6],如可能是完全实施的n次重复,可能是部分重复,也可能是部分实施,还可能会出现缺区现象。因此,就某一试验结果的数据输入通过会出现很多情况,在软件设计时都必须给予充分的考虑。但是,不管“3414”试验实施过程中会出现什么样的情况,其结果仍可归纳出一个共同的规律:每个取得有效试验结果数据的小区都有1组与之对应的设计参数,从而数据的输入就可归纳为2种数据组的输入:一是各小区设计参数的输入,二是各小区试验结果数据的输入。在数据的输入方法上,可以通过文本框以字符串的方式输入,也可通过文本文件或电子表格文件导入。数据输(导)入后,再用Split函数分离给设计矩阵(A)变量和依变量矩阵(Y)变量,从而完成数据的输入。对处理小区均相同的多个试验,则可使用相同的设计矩阵参数,将各试验结果数据一并输(导)入,供一并分析,以方便统计和管理人员快速分析审核多点试验资料。

3.3 回归分析

回归分析分3个部分:一是通过设计矩阵A和回归分析模型计算生成结构矩阵X;二是通过X的转置矩阵X′与X的乘积矩阵的求取逆阵C;三是通过依变量矩阵Y、结构矩阵X和逆阵C求取偏回归系数矩阵B,从而完成回归分析,建立试验的回归方程。

3.4 方程分析

方程分析主要包括3个方面:一是方程显著性检验。首先是通过F测验对回归方程进行总体评价;其次是方程F检验显著再对偏回归系数进行显著性检验。二是方程合理性分析。通过对各试验因子(Xi)求导后,分析各因子的一元二次回归方程,看其一、二次项的系数的正负性及其顶点位置,判断其合理性,从而确定回归方程的可用性。三是最高产量和最佳效益参数分析。通过上述2步检验确认方程合理可用时,首先通过对回归方程求导,获取最高产量时的施肥参数方案;其次是通过对试验肥料数量替换为价值因子后,求取最佳经济效益时的施肥参数方案。

3.5 反馈设计

在获得试验的回归方程后,通常会出现方程的边际产量并不出现在设计的2水平,有的偏差较大,甚至超出了试验设计范围(如大于3或小于0),这常给试验分析和下一步试验设计带来困难。通过运用计算机的高效运算效能,通过对方程各因子进行一定级度(精度可调)试验全域(0~3)扫描,求取方程所反映出的实际边际产量水平时的施肥参数,再将此参数反馈给试验设计者,用于作为下一次试验设计2水平的参考,从而可有效加快试验实施的进程,提高试验精度。

4 参考文献

[1] 莫惠东.农业试验统计[M].上海:上海科学技术出版社,1984:151-174.

[2] 张建玲,赵宏儒,马丽萍,等.固阳县旱地马铃薯测土配方施肥田间肥效试验[J].内蒙古农业科技,2011(1):75-77,118.

[3] 张明安,马友华,褚进华,等.基于WebGIS的县域测土配方施肥系统的建立[J].农业网络信息,2011(6):20-23.

[4] 张国峰 贺立源 韩松,等.基于移动GIS的施肥推介系统研发[J].华中农业大学学报,2011(4):484-487.

[5] 郭小军,王晓燕,白志荣.对测土配方施肥工程的思考[J].内蒙古农业科技,2007(5):9-10.

数据分析设计范文第4篇

关键词:故障数据;远程数据分析;地铁车辆;平台设计;轨道交通;实时数据显示 文献标识码:A

中图分类号:U279 文章编号:1009-2374(2017)11-0007-02 DOI:10.13535/ki.11-4406/n.2017.11.004

1 概述

S着城市轨道交通的快速发展,地铁成为人们出行不可或缺的交通工具。地铁车辆作为运送乘客的主要载体,具有封闭性强、起停频繁、客流量大且来源复杂、乘客自助乘车、应急疏散难度大等固有特点,因此对其自身的可靠性及维修保障工作有着非常高的要求。搭建地铁车辆远程数据分析平台可以运行地铁车辆提供远程决策支持,对列车开展实时监控和故障处理,并通过故障统计和数据分析进而达到车辆优化设计的目的。

2 平台需求

2.1 功能需求

以列车运营管理的实际工作需求为核心,提高列车组效率和效能,节约维修费用,减少事故率为目标开展建设工作,其主要具有列车组及关键部件的实时监视、故障预测功能。

通过列车组及关键部件或子系统当前状态,对故障进行诊断或识别,并对潜在的故障进行预测或报警;根据故障诊断及预测信息、当前维修可用资源情况以及对系统的使用需求等对列车组或关键部件的维修活动提供决策支持和建议。实现一套列车组及关键部件的状态检测、故障诊断、运行监控、故障预测及决策支持的完整系统,同时针对不同子系统/产品建立全生命周期的产品数据服务,满足企业对生产、运营维护、设计优化、采购等不同环节决策的支撑要求。根据业务需求,系统具有以下功能:

2.1.1 车载系统。由系统检测、故障诊断、集中报警及无线传输等组成。通过在列车组及各子系统上安装各种传感器,获取动车组及关键子系统传感器及控制系统的数据。利用故障特征提取、数据分析及对比、基于模型的系统辨识等多技术相融合的故障诊断技术,实现牵引、制动、辅助等各子系统的在线故障诊断(故障定位到最小可更换单元)和故障报告,通过车载无线传输系统将状态数据和故障数据传输至地面。

2.1.2 运行监控系统。列车状态、故障监控、综合诊断及应急处置等组成。根据列车组和关键零部件的运行状态,提取与列车组安全运行相关的数据及关键技术指标进行监控。根据车载系统传输的故障报告或关键设备技术状态数据对当前列车组运行状态进行评估,对潜在的故障进行综合诊断,形成综合评估和故障诊断报告,依据故障等级对列车组进行控制,对列车组现场人员提供技术指导和应急处置方案。

2.1.3 健康维护系统。由故障报告、健康评估、故障预测、维修管理等组成。根据列车组车载系统及运行监控系统报告的故障数据和列车组设备状态数据以及积累的历史数据,在地面利用高性能计算机及检测系统实现智能故障推理、关键机械部件的故障发展趋势模型,实现列车组及关键部件健康状态评估及故障预测,给出列车组系统的综合评价指标,提高列车组或部件的维修管理水平。

2.1.4 决策支持系统。由状态维修、寿命预测、服役跟踪、档案管理等组成。根据地面系统存储的列车组及关键部件的大量数据和历史档案数据,利用数据挖掘、故障模式识别等手段,建立关键机械部件故障发展趋势模型库,电子零部件的连续量、离散量、开关量等不同性质的故障预测模型库,建立列车组及零部件健康档案,进行零部件寿命预测、服役跟踪和档案管理,给出维修决策,形成列车组及关键部件健康评价指标体系。

2.2 业务需求

根据地铁车辆远程数据分析系统提供的核心功能,具体的业务需求为:

2.2.1 数据采集存储模块。主要实现列车实时数据和离线数据的接收、转发、解析、存储等功能。

2.2.2 实时状态检测模块。对列车的关键部件工作状态、运行线路、故障数据进行管理和处理,以可视化的形式进行展示。

2.2.3 分析统计模块。对列车的历史数据、离线数据结合知识库,进行统计分析,以可视化的形式进行展示。

2.2.4 后台管理模块。对整个系统进行综合的后台管理,管理员通过Web登录管理系统后,可以进行用户管理、权限管理、日志管理以及资料管理等操作。

3 总体设计

3.1 搭建原则

以创新驱动、资源共享为引领,整合地铁和现代信息技术等先进成果,打造创新、高效的列车远程数据分析。系统是一种具有基础性的支撑体系,数据来源广泛而零散,它具有整合和共享的服务性质。

3.2 业务架构

以列车智能维护为目标应用领域,围绕其数据增量的特点,建立流式数据接入、存储管理、实时跟踪以及异常识别的全业务链服务体系。结合当前技术缺陷,在平台搭建中实现流式数据实时处理与离线分析工作的结合。

系统建设的目的是针对列车监测数据,提供一体化、智能化的数据支撑服务环境,实现多源数据的存储、管理、分析。其主要包括采集层、现场处理层、接入层、IO层、持久化层、分析处理层以及服务层共七个基本层次。

3.2.1 采集层:其通过各种传感器与车上网络环境形成数据采集环境。采集的各种对象的监控数据经过汇聚后,统一开展现场处置与传输等后继工作,其依赖列车通信设备。

3.2.2 现场处理层:其在采集层数据的基础上,根据管理机制对数据进行检测,发现异常对象的前兆与警报信息,并通过列控数据交换机制及时预警或值警,同时根据不同数据的业务重要性以多种方式回传后台。另外,结合列控网采集手段,在列车检修阶段采集有关数据并回传,满足后台管理、分析与业务支撑的要求。

3.2.3 接入层:根据不同类别数据的规范要求,清洗数据并存储入库。

3.2.4 IO层:利用文件系统实现底层数据的基本IO存储与读取。通过文件系统有效实现系统整体IO读写负载的平衡,满足数据持久化存储的基本要求。

3.2.5 持久化层:由基本数据库构成。在这一层中围绕列车海量、多维流式监测数据提供高性能数据存储管理系统。这一系统结合IO定向分布、流数据增量分段存储模型等方式,实现流数据集的规模可控,解决由高增量引起的存储膨胀问题;针对列车数据实时主动的需求特点,在键值存储模型的基础上,建立边界溢出主动机制,槌志貌阒械氖凳敝鞫提供基础。

3.2.6 分析处理层:在内存数据集的基础上构造基于连续窗口的事件多维数据主动协同机制;结合底层数据主动机制以及数据pub/sub机制实现增量过程中,事件的主动识别、跟踪与触发响应。

3.2.7 服务层:提供故障(报警)统计查询、实时数据查询等用户服务。

3.3 逻辑结构

远程数据分析平台由服务器端软件、Web端软件两部分组成。

3.3.1 服务器端软件。根据数据类型有流式、结构化以及查询模式化的特点,结合关系数据库构成一体化的存储管理支撑环境,完成数据的统一存储、管理。

3.3.2 Web端软件。提供系统实时状态监测、数据分析和预警等基本功能;为整个系统的数据处理和数据等操作提供统一的配置管理平台,包括用户信息管理、用户权限分配等系统管理功能,组成系统的综合信息管理环境。

3.4 物理结构

3.4.1 实时数据。(1)列车实时通过地面4G无线传输通道通过以TCP协议将车载数据分别传输到检修库服务器和车辆段服务器;(2)检修库和车辆段的实时数据采集存储软件同时对协议数据进行数据采集、解析,解析后的数据通过以太网存储到数据库,对实时数据长期存储;(3)Web程序读取数据库,对数据进行可视化展示;(4)用户通过以太网使用浏览器,在网页中进行查看。

3.4.2 离线数据。(1)车辆到库后,维护人员使用HMI进行手动触发进行车辆数据上传或者TCMS根据时间触发条件自动上传车辆数据,借用库内WLAN技术,以TCP或者FTP的协议发送到车辆段或者检修库服务器;(2)车辆段服务器中的离线数据采集存储软件对数据进行数据采集、解析,并将解析后的数据内容通过以太网的方式存储到数据库中;(3)Web程序读取数据库,对数据进行可视化展示;(4)用户通过以太网使用浏览器,在网页中进行查看。

4 结语

随着地铁车辆远程数据分析平台的搭建,可以大大提高车辆自诊断及维修智能化水平,提升维修诊断效率;降低人工成本,提高车辆的可靠性和安全性;更便于建立车辆维修智能化数据库,优化维修模式,提升资源利用率,随着车辆的数据累计,更加可以利用云计算、数据挖掘、神经元算法等提供车辆运行的安全性和可靠性,为后期车辆的设计改进提供强有力的数据支持。

参考文献

[1] 仇辉.智能交通管控平台中数据分析子系统的设计与实现[D].北京邮电大学,2015.

[2] 吕赫.动车组车载信息实时传输方案研究[J].铁路计算机应用,2013,(1).

数据分析设计范文第5篇

关键词:互联网+;中职英语;闯关模式;数据分析

一、引言

随着“互联网+”时代的到来,各行各业都发生了巨大变化。把互联网平台、云数据、信息通信技术与教育行业结合,或许可以在教育领域里创造一种新生态。[1]在互联网信息技术支持下,职业教育手段多样,学习途径也可以变得简单方便。信息化的教学手段不仅可以激发学生的学习兴趣,更可以使学生利用零散时间学习,打破传统教学时间和地域的限制。除此外,利用平台反馈的各种数据,教师可以随时掌握学生的学习进展和学习效果,因地制宜规划教学任务、改进教学方法、调节教学进度等。另一方面,基于闯关模式的信息化教学平台也在逐渐走入中职院校的教学课堂。由于目前大多数中职院校的英语教学主要采用传统的课堂教学手段,即“填鸭式”的教学方法。在这种教学情形下,学生学习的主动性不高,师生课堂互动少,学生缺乏学习成就感,厌学情绪强烈,导致教学效果不理想。因此,“互联网+”背景下的闯关模式教学正是利用中职学生爱玩游戏的天性,在模拟闯关游戏的情境下,在教学平台上进行游戏式英语教学。[2]让学生在游戏中主动学习,在学习中感受到游戏带来的乐趣,达到在轻松氛围中掌握知识的目的。与此同时,闯关模式的教学进度和教学成果的数据分析功能也尤为重要,通过数据分析教师可以更好的反思自己教学方式需要改进的地方,从而进一步优化教学内容。文章通过研究闯关模式的教学意义、教学流程以及教学数据分析在中职英语教学的应用,可为现阶段基于闯关模式的中职英语教学实践提供有效的方法,具有中职英语教学借鉴价值。

二、闯关模式在中职英语的应用

职业教育是以学生服务为核心的服务型教育,目的在于培育学生在步入社会工作时拥有一技之长,而不仅仅是一纸证书。大部分传统课堂教学有师资、授课时间和地点的要求,由于课时和课外精力有限,教师往往以急于完成教学大纲要求,采取“满堂灌”“一刀切”的教学方法。由于中职院校学生的基础较差,学习主动性不强,学生彼此能力不一,教师对学生的基础及进步空间不了解,“教师灌输,学生厌学”的教学方式使得教学效果很不理想。英语作为基础学科具有一定的特殊性。在中职英语教学过程中,师生互动和生生互动是非常重要的学习过程,学生敢于表达是学好英语最有效的方法。所以,在教学过程中,首先应激发学生的学习兴趣,提高学生的学习自信心,让学生敢于用英语表达,乐于用英语进行互动。使学生于交流表达互动中,逐步掌握英语的词汇、语法等。闯关模式是基于游戏设置,通过合理设计“游戏关卡”来逐层加深知识的难易程度,整个闯关游戏所有的关卡设置内容既包含理论知识所需要掌握的知识要点,又包含具体应用的实操技能训练环节,形式多样。闯关模式的实质是利用游戏激发学生的学习兴趣,在游戏成功闯关后让学生获得学习成就感,增强学习信心与动力,从而爱上学习英语,变被动学习为主动学习。[3]闯关模式设置时一定严格按照教学大纲的内容,并且时刻注意学生学习过程中反馈的各种数据,根据数据分析掌握学生学情。

(一)闯关模式在中职英语学习中的设置

闯关模式按照学习内容的难易程度设置成不同等级的关卡,以移动终端的网络平台为支撑,学生以个人或小组的形式进行闯关。闯关模式的目的在于吸引学生主动参与学习,通过这种教学模式提高了学生应用英语的整体水平,同时也提升了教师的英语教学技能和研究能力。所以,游戏是手段,不能只注重学习过程,而忽视教学成果。学生要想闯关成功,就必须要掌握融入到闯关游戏中的各种英语知识和相关表达。闯关模式教学内容的设定是核心工作,是教师应“三思而后行”的任务。教师应依据教学任务,首先将教材内容进行分析梳理,按照教学流程(单词-语句-阅读)或者所学内容的难以程度进行梯度划分,将梯度设置成“关口”。[4]在每一次闯关之前,教师可以将教学任务中布置的闯关相关词汇和句型进行讲解,建立所谓的“闯关须知”,学生要想闯关成功,必须先学会相关的词汇和句型。开始闯关后,可将闯关任务分解,以个人或团体的形式闯关。教师可以将全部的学习任务放入“通关锦囊”中,供闯关失败的学生参考,为下一次闯关做储备。在闯关任务完成后,教师应及时通过后台数据了解学生的学习情况,如答题速度,思考时间,正确率,易错选项等数据,及时对学生的闯关结果进行考核与评价,以最快的速度了解学生学情,进而对教学内容和教学进度进行调整,以适应学生的学习步伐。教师在考核评价完成后应将闯关结果及时反馈给学生,学生在收到教师根据数据发表的相关评价后及时进行学结,为以后的闯关打好基础。下面以“MyInterest”主题教学任务为例,按照上述流程教师可将该主题分解成“兴趣词汇”“兴趣对话”“兴趣展示与比拼”等几个游戏环节,按照对应内容依次设立成“基础词汇关”“提升句型关”“终极表达关”“兴趣展示关”等难度不一的关卡,再根据教学任务要求,将和MyInterest有关的词汇、句型和片段阅读放入“闯关须知”中,让学生进行闯关前预习,以便于他们掌握通关的基本技能,降低闯关难度。闯关过程中,教师也可结合学生闯关的情况,随时发现学生的学习问题,随时记录,以便后期问题的讲解。任务结束后,将教学大纲中的主题相关课程讲解放在“通关锦囊”中,帮助学生学结。

(二)闯关模式教学设置的注意事项

首先,闯关设置的教学内容应遵循教学大纲规定。按照大纲规定的课程学习内容进行选择,并且要注重理论与实际的结合。闯关任务的设置应将教学目标自然地融入关卡中,紧密结合实训课程的能力目标,注意关卡中知识的环环相扣,知识点的引入要全面且不超纲。其次,教师要明确设置的关卡难度,根据教学内容的由浅入深,闯关所需掌握的知识也应按逐级增加的原则设置,这样学生才会有闯关的成就感,有继续闯关的勇气,在逐级过关后积累知识。[5]例如闯关时设为一颗星难度、两颗星难度、三颗星难度等类推。每一次闯关都要明确必备知识,时间限制和过关要求等等。以上文提到的“MyInterest”话题为例,具体任务分解可参照一下表格:在学生完成任务后,教师可以要求学生写出完成任务后的困惑、感想及感悟等,同要求掌握的词汇和句型一并放到“通关锦囊”中,作为闯关失败重新闯关或者后面闯关同学的闯关指南。最后,闯关设置任务切勿本末倒置。闯关的是为了提高学生的学习兴趣,使学生在轻松愉快的环境中完成学习。闯关不是目的,达到教学目标让学生掌握必备的英语技能才是最终目的。因此,在闯关后,教师应该针对学生闯关过程中表现出来的学习情况、能力表现等进行客观、真实地评价。利用平台数据的反馈建立相应的学生测评报告,将实训成绩纳入学生期中期末的总成绩中,激发学生的竞争意识。笔者曾针对中职英语教学现状和中职英语闯关模式教学现状对学生进行过问卷调查,问卷调查的对象分别是笔者所在的南靖第一职业技术学校2015级随机抽取的60名学生,共发放60份问卷,收回60份问卷,回收率100%。虽然该调查具有局限性,但是在一定程度上也反映了目前中职学生英语学习的现状对比情况。从问卷调查结果中可以看出:闯关模式教学可以提高学生的学习兴趣,有助于提高学生的英语学习成绩,并且有效提高了英语课堂的学习气氛,提高了学生的学习主动性。

三、闯关模式教学中数据分析的重要性

互联网带动了云数据的发展,使人们无论在何时何地都能用数据进行总结分析和预测。在中职英语的闯关模式教学中,教师除了设置闯关教学内容外,还要重视平台反馈的数据,要对数据进行收集整理和分析,从数据中采集学生学情等信息。利用闯关模式教学的目的在于激发学生的学习兴趣,如何验证教学模式的有效性?闯关模式的平台可以设置诸多数据,仍以上文提到的“MyInterest”学习主题的第一关基础词汇关为例,可以根据单词的闯关测试设置拼写速度、反应时间、正确率、历史错误率等数据。学生每闯过一关,教师就可以在后台收集相应的数据,收集所有学生的数据后,进行分析,为每一学生建立测评报告。通过测评报告,教师可以了解学生知识掌握情况,结合线下教学,帮助学生补短板,提高整体英语学习水平。除了学生的个人测评报告,教师还应建立闯关模式教学任务的整体测评报告。例如:对于错误率较高的单个知识点找到学生犯错的共性,利用线下教学面授优势,为学生细心巧妙讲解,突破重点难点。同时教师利用闯关模式平台数据可以直击学生学习难点,有效地指导学生学习,利用数据结果提高备课速度,不断优化设定的教学内容。总之,应用闯关模式等其他互联网平台作为新型教学手段,改革传统中职英语的教学模式,可不断提升中职学生对英语的学习兴趣和能力,同时通过平台中的数据反馈与分析还可以大大提升中职英语的教学成果,可实现为企业输送优秀的英语人才。

参考文献:

[1]张聪.基于“互联网+”积件式资源建设的中职英语教学探索[J].考试周刊,2016(32).

[2]王彩云.“互联网+”时代背景下的中职英语教学初探[J].教育(文摘版),2016(2).

[3]曾丽婷.闯关式翻转课堂教学模式构建与实施[J].中国教育信息化,2015(12).

[4]陈寅,张玉珊.互联网+环境下英语教育改革与创新思考:兼评《英语语言教学改革与创新二互联网+教育探讨》[J].中国高教研究,2016(2).

[5]吴建华.闯关模式在中职英语技能训练中的应用[J].厦门城市职业学院报,2016(6).

数据分析设计范文第6篇

关键词: 数据分析课程 翻转课堂 教学设计

数据作为信息的主要载体,在当今“大数据时代”背景下扮演着重要的角色。对数据的分析和利用已经成为每个行业重要的生产因素,并广泛应用于各行业和领域。数据分析就是用适当的统计方法对收集的资料进行详细的研究,提取有用的信息并形成结论,以求最大化地开发数据资料的功能与发挥数据的作用。在我校,数据分析课程是信息与计算科学系的必修课程,对提高学生的建模能力及数据分析水平有重要的作用。

数据分析课程的特点就是要求学生具备较高的理论基础水平、综合应用及动手能力,还需要学生掌握必要的分析解释能力。将理论与实际案例结合,发挥学生的主观能动性,增加学生的动手实践和分析解释环节,是数据分析教学中必须遵循的原则。而翻转课堂正是通过对知识传授和知识内化两个环节的颠倒,实现学生对授课内容的理解和对知识点的内化,也就是理论结合实践的过程。因此本文针对数据分析课程特点和存在的问题,结合翻转课堂的教学理念,对数据分析课程各个教学环节进行设计研究,以期促进数据分析教学,使之更好地为专业素质的培养提供服务。

一、数据分析教学存在的问题

1.理论教学

数据分析课程的理论与方法内容丰富,涉及面广,应用范围大。在理论教学中,学生学习理解掌握理论基础具有一定的难度。如对各分析方法的理解掌握,必须建立在良好的数学基础上,综合运用所学数学知识才可以理解各种数据分析的理论分析原理。同时学生还需要理解掌握各分析方法理论的内在联系,并把握其不断发展的趋势,才能真正掌握数据分析的理论与方法。我校现在的数据分析课程教学理论课程授课方式单一,传统教学方式使学生只能对课程方法理论浅尝辄止,无法深入了解,综合运用。同时单一的课堂授课模式无法对学生的掌握程度进行有效的评价和检测。

2.实践教学

数据分析课程对学生的动手能力要求很高。学生在理解掌握各种分析方法的理论基础上,需要掌握一定的统计软件的使用方法,如SPSS,MATLAB。这需要将理论方法,如复杂的公式,与实际软件使用相结合。实验教学中,要求学生有较高的计算机编程能力,然后结合数据分析的理论方法,对数据进行分析,并应用于实践。现阶段我校数据分析课程中,学生实践课时偏少,而且传统授课模式让学生的学习处于被动状态。实践教学中只能根据老师和教材的指导,对课本上的例题程序进行练习,极大地限制学习广度和深度,且无法有效地将本课程与实际生活与应用联系起来,从而挫伤学生学习和动手的积极性。

3.学生能力培养

数据分析课程对学生能力的培养体现在综合运用能力和对结果的分析解释能力。理论课程传统的填鸭式教学,和实践课程拘泥于教材的例题程序的现状,将数据计算与数据分析分割开来,势必会限制学生综合运用能力和分析解释能力的发展,影响学生学习兴趣和课程教学效果。

二、翻转课堂教学理念

翻转课堂起源于美国林地公园高中,两位化学老师通过让学生在家观看视频,课堂进行练习的方式,完全颠覆传统教学模式。翻转课堂将传统教学模式中知识传授和知识内化两个阶段颠倒过来。与传统授课模式不同的是,知识传授不再是完全由课堂中教师的讲解完成,而是通过信息技术的辅助在课前或课后等业余时间完成,同时知识的内化不再是单一的由课后作业或者练习完成,而是通过在课堂中进行疑难解答、项目式学习、合作学习等方式进行。因此,对翻转课堂教学方法的实际有效利用可以将大学生学习时间最大化,并培养学生的自学能力、自我约束能力及分工合作能力。

在数据分析课程教学中,学生可以利用课余时间,结合教师提供的数据分析每一模块的课前学习材料,实现对数据分析课程基本方法和理论的了解,这样很好地利用学生的课余时间,培养学生的自学和约束能力。而对所学数据分析方法的具体应用、深入理解及综合分析等方面,学生可以通过课堂的各种活动和学习方式,以及和教师的及时沟通,和同学的合作交流等方式,在知识内化这一环节获得比传统课堂更好的学习效果。

三、翻转课堂在数据分析教学中的应用设计

近些年国内外很多对翻转课堂教学的研究,形成针对各个学科和地区的教学模式。如RobertKarplus提出的“探索-解释-应用”三阶段学习周期,RamseyMusallam提出的“探索-翻转-应用”模式,国内南京大学张金磊等人提出的由课前学习和课堂学习组成的翻转课堂教学模式等。

针对数据分析课程学科特点和本校学生基础水平及实际情况,本研究提出数据分析翻转课堂的教学流程:

课前――概念探索教学视频平台交流

课中――问题解决(经验交流,教师讲解)测试反馈项目创建协作学习及汇报

课后――平台交流,作业反馈

在课前教学环节中,概念探索是根据数据分析课程的学科特点设计的,由于学生初次接触数据分析,对很多基本概念及意义没有深入了解,意识不到社会意义和实践意义,在这一环节中学生可以通过教师给出的简单具体的实例演示,再加上信息丰富的网站、视频及博客等手段在教学交流平台上阐述自己对所学概念的理解,相互交流,以此实现对概念的初步正确理解。如对聚类分析的理解,学生可以概念探索这一过程中通过具体实例演示和对各种信息的阅读,了解到聚类分析作为数学工具的基本思想和在现实生活中的重要意义。

教学视频主要是微视频和幻灯片。对于教学视频的观看,要求学生针对自己的数学学习基础有选择地观看。教学视频中主要针对本单元学习内容进行讲解,同时还会提供与本单元学习相关的数学基础理论的教学内容。这种数学基础与数据分析内容相结合的教学材料可以让数学基础不完善的学生更有效地理解本单元的知识。在视频或者课前学习资料的制作中,需要结合每一章节的实际,主题突出,简短生动,而且有效。如在聚类这一章节中,对于各种聚类方法的介绍可以结合具体的实例,如与生活密切相关的人均家庭收入问题等,通过不同方法展示对比,从而做到对每一聚类方法的理解和融会贯通。同时需要介绍相关的Matlab编程方法,让学生结合理论和实际,通过编程过程实现对理论知识的理解和应用。

课前学习中,反馈是比较重要的一部分。教师可以通过平台交流得到课前理论学习的反馈信息,同时可以通过在线学习简单的作业练习,由此获得课前学习的反馈。

课堂教学仍然是很重要的一环。课堂上教师首先组织学生面对面交流,解决并了解课前学习中遇到的问题,对普遍性问题做详细解答。然后经过简单的例题让学生编程实现,并进行相应的解释,由此测试学生的学习效果。这样教师可以更好地掌握学生对每一章节数据分析理论的学习效果,以及学生对理论的应用构建能力。在保证学生对概念和理论的学习后,教师可以提供项目创建的基本信息和参考实例,如数学建模题目等。学生分组合作交流,选择自己感兴趣的问题成立合作组,结合本章节内容分析解决问题,寻找合适的数据处理方法,应用相关软件编程实现自己的想法,将理论应用于实践,并进行有效的分析,学生的问题解决过程和讨论过程可以在课下进行。在学生充分准备后,课堂上进行分组汇报,并进行自评和互评,实现学生对理论的应用和相互学习。

本章节教学内容结束后,教师组织学生在教学平台交流,并展示自己的作业和反思内容,巩固对本章节内容的理解。

四、教学设计效果分析

1.符合大学生学习特点

大学生作为已经独立的学习个体,拥有独立的学习和思考能力,同时具备独立学习时间和空间,而传统教学方式无法充分发展学生的独立学习能力,让学生的课余学习漫无目的,松散自由,无法充分利用课余时间。翻转课堂在数据分析课程教学中的应用让学生在课余时间的学习有的放矢,通过学习交流平台还可以相互交流督促,培养学生良好的独立学习和探索学习的习惯。

对于思想上已经独立的大学生来讲,个性化学习更符合学生的行为习惯和思想意识。在数据分析课程的学习中,学生可以根据自己的基础、学习习惯及自己的喜好等自由选择学习的材料、时间和方式,互不打扰,又可以相互交流。如对概念和理论的理解,学生可以通过网络资料,也可以选择图书馆的书籍,观看教学材料等方式进行,每位学生理解的深度和广度可能会有所不同,通过相互交流和共同知识构建和应用又可以相互弥补。这样的教学和学习方式极大地满足了不同学生对知识的需求,避免一刀切式教育,可以充分发挥学生的学习潜力。

2.增强学习效果

通过初步的教学实验,接受翻转课堂数据分析课程的学生无论在理论知识理解还是实践应用上都有明显提高。相对于传统课堂中的学生,在数据分析课程结束后,翻转课堂中的学生可以较好地阐述相关理论,通过Matlab软件编程实现对理论的应用,并给出合理的解释。通过测试对比可以看出,翻转课堂中的学生理论基础更加扎实,编程能力有很大提高。在翻转课堂试行后,学生在数学建模大赛中成绩有明显进步。

3.改善教学氛围

在数据分析翻转课堂中,学生学习积极性有很大提高。首先学生已经通过概念的探索阶段对所要学习的知识有初步了解和认识,能够较好地意识到所学知识的社会意义,增强学习兴趣和信心。其次,学习方式多样化,学生可以充分利用自己喜欢的现代信息设备,将手机、平板及电脑等学生喜爱的现代化信息设备变成学习的工具。避免学生与教师之间对手机等工具的对弈,改善学生将手机等单纯作为娱乐工具的现象。此外,学生在交流平台上的发言、总结和展示不仅乐意给学生带来成就感,而且可以激发其他学生的学习动力,形成你追我赶的学习氛围。

通过将翻转课堂理念初步运用于数据分析课堂,发现这一理念的运用可以有效解决目前数据分析课程教学中存在的一些问题,将理论教学与实践教学密切联系起来,并有效调动学生的学习积极性,取得较好的教学效果。在这一过程中,我们发现翻转课堂理念的实施不能拘泥于形式,需要根据具体问题和课程需要进行相应的调整。同时翻转课堂中需要教师付出更多精力进行探索,如更合适的教学资料和课堂活动设计。总之,翻转课堂理念的实施带来的不仅是教学形式的变化,更是对教师工作分工和角色的改变。

参考文献:

[1]宋艳玲,孟昭鹏,闫雅娟.从认知负荷视角探究翻转课堂[J].远程教育杂志,2014,(1):105-112.

[2]汪晓东,张晨婧仔.“翻转课堂”在大学教学中的应用研究[J].现代教育技术,2013,(8):11-15.

[3]张金磊.“翻转课堂”教学模式的关键因素探析[J].中国远程教育,2013,(10):59-64.

[4]周学刚.浅谈“数据分析”课程的教学[J].中国电力教育,2011,(7):110-111.

[5]窦建军.数据分析课程教学中的几点体会[J].徐州教育学院学报,2008,(3):146-147.

[6]梅长林,范金城.数据分析方法[M].北京:高等教育出版社,2006.2.

数据分析设计范文第7篇

关键词: 体育统计;SPSS;多因素;方差分析;正交试验设计;数据分析

中图分类号: G 8032文章编号:1009783X(2013)03028306文献标志码: A

在用三因素有交互作用的方差分析来研究运动强度、运动量和运动持续的时间对运动成绩的影响时,对影响运动成绩的3个因素各按3个水平进行试验,见表1。如果进行全面搭配法方案安排试验,此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是试验次数较多,为33×2=54次(指数3代表3个因素,底数3代表每因素有3个水平,×后面的2,表示重复一次试验),如图1所示。因素、水平数愈多,则试验次数就愈多[1]。例如,作一个5因素3水平的不重复试验,就需要35=243次试验。试验次数越多,就需要更多的人力、物力和财力作保证,而且需要占用更多的时间,这显然是十分困难的。有时由于所需的时间太长,使试验的条件发生改变,还会导致试验失败,即使试验有了结果,但对运动训练的实际指导意义也可能已经不太大了;因此,需要寻找一种合适的试验设计方法。

对于如何去做试验,怎样才能做好试验的问题是统计学很关注的一个问题。这就需要我们在做具体的试验前,首先要做好试验设计。

试验设计的一个最重要的原则:在做试验前,通过必要的事前考虑,作出合理周密的事先安排,从而在实际的试验中,通过动用最少的人力、物力、财力及尽可能短的时间,以便用最少的试验次数达到同做大量全面试验等效的结果。

1.1.3因素和交互作用

选择的正交表要能容纳所考虑的因素和交互作用。为了对试验结果进行方差分析或回归分析,还必须至少留一个空白列,作为“误差”列,在极差分析中要作为“其他因素”列处理。

1.1.4试验精度

在同水平中取何种试验次数的L表,取决于试验精度的要求。如果试验精度要求高,则宜取试验次数多的L表。

1.1.5研究的成本

要根据研究的成本来决定适合的L表的选择。若试验费用很昂贵,或试验的经费很有限,或人力和时间都比较紧张,则应选试验次数少一些的L表。

1.1.6修正水平数

在按原来考虑的因素、水平和交互作用去选择正交表时,如无正好适用的正交表可选,则简便且可行的办法是适当修改原定的水平数。

1.1.7适当选用大表

在对某些因素间的交互作用的影响是否确实存在没有把握的情况下,如果条件许可,则应尽量选用大表,让影响存在的可能性较大的因素和交互作用各占适当的列,在用方差分析进行显著性检验时,就可得出结论。这样既不增加太多试验的工作量,又不致于漏掉重要的信息。

1.2正交试验设计的基本步骤

1.2.1根据研究目的设计试验因素和试验指标

先根据研究课题来确定研究目的,再从专业的角度在众多影响研究目的的因素中找出几个主要影响因素,根据研究精度的要求和课题经费的情况确定因素的水平,一般在条件允许的前提下,主要影响因素的水平可以分得多一些,同时还将确定最能反映试验目的的测试指标,以便通过对试验结果的分析找出主、次影响因素。

3结论

1)正交试验设计可有效地减少试验次数,同时还可得到与做大量试验等效的结论,可以节省大量的人力、物力,提高研究经费的使用效率。

2) 在SPSS17.0中,可以利用数据菜单中正交设计过程中的生成程序产生正交表,用显示程序打印正交设计方案。由SPSS17.0产生的正交表同正交试验设计书中的正交设计表不一定相同。在需要作极差分析的同时,还要考虑交互作用,应根据交互作用表作表头设计。

3) 在不需要极差分析或极差分析中不需要考虑交互作用时,可直接采用SPSS17.0产生的正交表来安排试验(但生成正交表时要考虑求交互作用时的试验次数,即要根据因素数、水平数、交互作用安排在哪些列,来决定需要多大的正交表),也可直接用SPSS中多因素方差分析的方法来完成正交试验设计的方差分析,同时可考虑交互作用。

4)在用SPSS17.0进行正交试验设计分析可以代替手工计算。

由于篇幅有限,只讨论了各因素等水平的情形,其他不等水平的混合设计,在SPSS中的实现方法是相同的。

参考文献:

[1]刘达民,程岩.应用统计[M].北京:化学工业出版社,2004:153156.

[2]刘汉生,张宝玉.应用数理统计基础[M].山西:山西科学教学出版社,1987:237266.

[3]王岩,隋思裢,王爱青.数理统计与MATLAB工程数据分析[M].北京:清华大学出版社,2006:183238.

数据分析设计范文第8篇

【关键词】医学;数据分析;信息管理系统

0.引言

21世纪以来,社会的各个方面,各行各业发生着日新月异的变化,计算机的普及与应用已经融入到了经济、政治、文化的各个领域,电子信息化的有效性使我们摆脱了繁重的文书工作,同时也增强了我们对于信息的利用性。医学信息管理系统的实现一方面充分体现了计算机强大的信息收集、数据处理功能,使医疗数据的利用率得到了提高,数据的保存和提取更加的快捷方便,保存时间也大大增长;另一方面,避免了繁琐的文书记录、数据分析统计工作,减轻了医疗工作者的工作负担,不仅提高了他们的工作效率,还使整体服务质量得到了改善,管理水平得到增强。

1.医学信息管理系统的必要性和可行性

医院整体系统的庞大,工作内容的繁杂,需要有一种技术可以对医学数据进行更好的整理和分析。在门诊挂号时需要进行的手续较多,采用手工记录书写的方式操作,则会使排队的人越来越多,不能使病人在最短的时间内得到治疗,同时大量的人群会增加医院工作人员的压力,更容易出现错误,长时间的等待和工作也增加了两者在交流过程中发生摩擦的几率;在门诊看病的过程中,采用记录病历的形式,并不能在患者再次看病时迅速的提取出原来的纪录,这在无形中增加了医生的压力和工作量,不方便医生对患者的病情进行更详细的分析,对患者们的研究更是需要大量的工作。另外医院的其他部门比如财务管理系统,人事管理系统,药品库存管理系统,门诊挂号系统,划价收费系统,综合查询系统等等都存在等待时间长,工作效率低的问题,而计算机技术的不断发展和应用,可以很好的满足这个需求,计算机管理系统的出现使得医疗数据的记录、查询、统计和分析消耗时间短,工作量小,工作效率高,保存时间长,满足了医院对数据系统整理的要求,具备了快速的响应能力和联机事务处理能力,使管理更加优秀和有效,可以使患者享受到更好的服务。

实现医院信息化管理需要的计算机技术并不复杂,医院中信息化管理主要处理文字和数据,基本不会用到多媒体数据的动态传递。从这方面来说,所需服务器的性能要求也不太高。因此,建立医院信息化管理所需投入不会太高,但是由此产生的效果却是明显的。

2.信息管理系统的设计

2.1系统的设计思想和特点

(1)本系统所构建的网络采用局域网的形式,医院内的计算机都可以登录到这个系统。

(2)完整的信息管理系统涉及医院的各个部门,将不同部门联系在一起,数据实现共享。

(3)该系统设有不同等级的管理人员和医务人员,其中一部分人可以对信息进行记录和修改,一部分只能对信息进行查看,保证信息的安全性和有效性。

(4)设计可以使系统进行修改和改革的程序,使系统保持先进性。

2.2系统运行环境

为了保证系统运行的效率和可靠性,应该保证系统服务器具有较高的软硬件配置,但对于客户端的要求不是很高,一般的客户端都可以满足要求。此应用程序可广泛运行于国际互联网即因特网,同时也可适用于内部的局域网。其硬件要求很小,运行要求较低,有利于广泛的使用。

2.3系统的总体结构设计

利用医院内部局域网将各个部门联系起来,各个计算机的数据可以进行共享。在系统管理方面,设定不同等级的管理人员和医务人员,医院最高等级的领导可以对系统进行最大程度的控制,系统设定密码,密码管理员可以添加医务人员并修改医务人员的密码。病历管理人员可以查看所有患者的治疗信息但不能进行修改,门诊则负责对病历的录入和修改。相关人员只能修改对应职位的信息。所有信息的查看在各个计算机上是互通的。

2.4基本设计概念以及相关技术介绍

本系统使用ASP技术框架和局域网数据库,程序在IIS服务器端运行,以大大加快了数据的处理速度和安全性。为了使数据库保持先进性,方便修整和改革,系统设计应采用模版方式,界面的修改完全不影响处理程序流程。设置数据库维护系统,方便对整个系统进行管理。根据每个不同类型的用户分别为其制作独立的管理或者是操作页面,以便区分和提高系统安全性。

ASP:全称是Active server pages,意为“动态服务器页面”,是微软公司开发的代替CGI脚本程序的一种应用,在这里可以生成和运行动态的、交互的、高性能的Web服务应用程序,是一种简单、方便的编程工具。ASP是一种服务器端脚本编写环境,可以用来创建和运行动态网页或Web应用程序。ASP网页可以包含HTML标记、普通文本、脚本命令以及COM组件等。利用ASP可以向网页中添加交互式内容(如在线表单),也可以创建使用HTML网页作为用户界面的web应用程序。它不仅仅是一种编程语言,更不仅仅是一种开发工具,他更是一种强大的技术框架和模型。

Javascript:是一种嵌入在HTML文件中的脚本语言,它是基于对象和事件驱动的,能对诸如鼠标单击、表单输入、页面浏览等用户事件做出反应并进行处理。

SQL(Structured Query Language): 结构化查询语言,是关系数据库的标准语言,通过几个命令,就可以实现定义、查询、更新和控制功能。在ASP 中对后台数据库进行查询、添加、删除和更新等操作所采用的就是SQL 语言。数据查询基本命令是SELECT,SELECT 语句用于对数据库进行查询并返回符合查询条件的数据。在查询语句中使用SQL库函数,可以实现在查询的过程中同时对某属性上的值进行统计分析。

这是主要涉及到的几种技术,除此之外还有其他便于使用的技术,通过对这些技术的应用,专业技术人员的设计就可以实现信息管理系统的实体化。

3.信息管理系统的设计分析

信息管理系统联系到了医院的各个部门,将收费、问诊、病历等结合在一起,为医院的信息化建设和科学化管理建立了一个很好的平台。该系统主要完成文本信息和医院各种数据的录入和整理,并使患者可以快速的查看的信息,同时各个部门之间信息的共享不仅可以使医院内部信息交流更加的及时和迅速。这不仅可以增加其他部门的监督的作用,使管理更加的公开透明,使得医生更加注重治疗技术的增强,并对患者的信息进行更好地掌握以供进一步的诊断,对于病人则更加的放心并对自己的花费、病情了如指掌。

4.总结

信息管理系统的设计和使用建立了完整性强、一致性高、数据安全可靠的数据库,简化了繁琐的文书操作,规范了整个医院的数据处理流程,系统中包含强大的数据处理功能,不仅可以清楚快速的查询信息,而且可以利用一些应用程序对数据进行统计分析,简明直观的了解到医院的各种信息,方便医院的管理,提高了医院各项工作服务的质量和效率,提高了患者的满意度,对于医务人员,大大减轻了他们的劳动强度,使他们有时间和精力来服务于病人,进一步的学习,这在一定程度上促进了医学科研和教学的进行。医院管理系统紧跟时代的潮流,采取新的形式改革管理体制,优化医疗服务,使医生患者可以更好的交流,为医疗领域增添了新的特色,随着计算机技术的不断发展,信息管理系统将会有更优秀的平台。

【参考文献】

[1]李蓉,李标庆.网络管理信息技术及其设计开发.江西通信科技,2002.

数据分析设计范文第9篇

关键词: 数字城管; 数据挖掘; 统计分析; Java EE

中图分类号:TP31 文献标志码:B 文章编号:1006-8228(2013)08-80-03

0 引言

数字化城市管理(简称“数字城管”)是现代城市的发展趋势,也是城市管理走向现代化的必然要求。实施数字城管,可以创新城市管理模式,再造城市管理流程,实现电子政务资源的整合与共享,从而提升政府城市管理水平和公共服务能力[1]。

近年来,许多国外发达城市相继开展了数字城管的研究和实践,实施数字城管也已成为中国城市管理建设的热点。2005-2007年,国家住房和城乡建设部先后确定了51个数字城管试点城市[2],目前全国已有300多个城市已建立了数字城管。以浙江省杭州市为例,2006年8月杭州市顺利通过国家建设部的验收,成为首批十个数字城管试点城市中第一个通过验收的城市,其创新模式被冠名为“杭州模式”[3];至2010年底,杭州市已建成覆盖城市市域的市辖城域数字城管统一平台。

在数字化城市管理建设过程中,数字城管信息系统综合利用计算机、网络、通讯和数据库等技术,积累了大量庞大又宝贵的数据[4]。从这些海量的原始数据中分析挖掘更实用、更全面的信息,对于城市管理的科学监管和执法具有重要的意义。

本文采用主流的Java EE技术,结合Spring和Hibernate框架,设计并实现了一个面向数字城管的数据分析与挖掘系统。系统充分利用统计分析方法和数据挖掘技术,能对数字城管信息进行综合分析和有效挖掘,为城市管理的科学决策提供全面、直观的依据。

1 系统总体设计与分析

1.1 系统总体需求分析

面向数字城管的数据分析与挖掘系统针对数字化城市管理领域采集的主要信息,例如行业监管业务数据、“四化”督查业务数据和城管执法业务数据等海量数据,综合利用统计分析方法[5]和范例推理技术(Case-Based Reasoning,CBR)进行数据挖掘[6],提取有价值的信息,进一步促进数字城管应用的知识发现和辅助决策,提升城市管理的水平和效能。

系统的主要功能模块包括:系统管理、简单分析、高级分析、分析查询和结果导出等。

系统管理:实现用户管理(包括用户登录、创建和修改)和信息管理(问题、案件的管理)。

简单分析:选取简单的维度、指标字段进行分析,作废分析等。

高级分析:选取复杂的维度、指标、图形区域等进行分析,包括钻取(Drill-up和Drill-down)、切片(Slice)和切块(Dice)等分析。

分析查询:提供历史的分析管理和记录查询。

结果导出:导出分析结果,包括简单报表、图形报表等。

系统的基本功能框架如图1所示。

1.2 系统关键技术

系统的关键技术主要包括以下几个方面。

⑴ 系统的技术选型采用目前成熟、先进的Java EE技术,符合主流MVC框架的设计架构,系统在软件上充分考虑可扩充性,软件系统采用模块化设计,注重提高系统的可移植性、安全性、可伸缩性和可重用性;同时采用插件式的方式集成系统中的各个模块,保证各个模块的松散耦合、集中统一。

⑵ 利用统计分析方法研究数字城管数据之间的关联关系。确定数据库字段之间存在的函数关系(能用函数公式表示)和非函数关系(不能用函数公式表示),通过统计海量数据中的最大值、最小值、平均值等常用统计方法,以及回归分析、相关分析、差异分析等常用分析方法,对数字城管业务的数据进行统计分析,挖掘出数据间存在的规律性和相关性。

⑶ 利用范例推理技术促进数字城管领域的辅助决策。现有的数字城管信息系统提供了大量的案例数据,系统采用CBR技术进行基于案例库的范例推理建模,利用常用的归纳索引法构建案例决策树,提取案例的显著特征,当出现新的案例时,首先在案例库中检索和整合最相似的案例,为新案例快速提供一个参考的解决方案,从而实现对城市管理的辅助决策。

1.3 数据库设计

系统共设计了员工、地点、问题、监管案例等12张数据表,部分数据表的描述如下:

⑴ 员工表:存储工作人员信息,包括姓名、编号和联系方式等基本属性;

⑵ 地点表:存储发生问题的地点信息,包括编号、区域、街道、社区等基本属性;

⑶ 问题表:存储对问题事件的描述,包含编号、来源、类别、状态等属性;

⑷ 监管案例表:存储所有立案的问题或事件信息,包括案例信息、处理信息等。

其中,监管案例表是系统统计分析和挖掘的主要来源,该数据表设计的重要字段及其含义如表1所示。

2 系统详细设计与实现

系统基于Java EE平台进行设计开发,以Oracle作为后台数据库,采用Hibernate实现持久层管理,采用Spring实现事务管理与依赖注入,使用Spring MVC的设计模式管理前后台的交互,同时综合了目前主流的AJAX框架、JavaScript技术、JS扩展类库等技术,充分展示了B/S架构的MVC设计模式的运用,可以在装有浏览器以及JRE支持的系统上直接使用。

下面对系统中信息管理和高级分析等关键模块的具体实现进行详细说明。

2.1 信息管理模块的设计实现

信息管理模块主要提供对数字城管案件和问题信息的管理,包括增、删、改等基本功能,以及分页、排序和过滤等附加功能,同时使用了“Google Suggest”模式提供对输入词汇的检索提示功能。

2.1.1 利用ExtJS实现自动分页功能

ExtJS是一个与后台技术无关的前端AJAX框架,主要用于创建前端用户界面。系统利用ExtJS的PagingToolbar控件封装的方法,实现对信息管理进行自动分页的操作,它显示从后台返回的总数据数,并且定义了“上一页”、“下一页”等功能按钮,分别封装了对应的请求,从而获取到相应的页面。

实现分页功能的前台页面部分代码如下:

后台利用一个Page的util类进行所有的分页操作,该Page类封装了分页的一些基本的后台操作以对应前台发来的请求,从而实现分页效果。

2.1.2 使用“Google Suggest”实现自动匹配功能

“Google Suggest”是Google搜索引擎重要的智能化服务之一,当用户输入所要搜索的关键词时,会以下拉框的形式出现关键词扩展提示。系统在实现过程中,也使用了“Google Suggest”模式实现关键词的匹配提示。当用户对案件信息进行修改或查询时,例如对上报监督员进行修改,只要输入相应人名的前一个或几个字符,系统就会自动在数据库中寻找匹配的名字列表,以下拉框的形式供用户选择,这种实现方式能够方便地对数据进行处理筛选,预先显示用户想要的数据。

系统实现该功能的过程如下:

⑴ 当获取到用户的请求数据后,设置请求的相应url为“employee?method=suggest”;

⑵ 后台接收到该请求后,通过关键字获取类似姓名的方法employeeService.getByName(name),对数据库中的Employee表进行查询,返回所有包含前端输入字符的人名,供前台选择。

例如,在案件信息管理模块中,如果修改上报监督员的人名,当输入一个“董”字后,将自动生成所有名字包含“董”的员工供用户选择,页面效果如图2所示。

2.2 高级分析模块的设计实现

高级分析模块能够提供多维度、多条件的统计分析功能,并且以柱状图、饼状图等直观形象的图表进行展示,使得分析结果一目了然,同时还提供分析结果的Excel文件导出功能。

2.2.1 分析结果的图形显示

例如,对基于地区的发案率进行分析比较,统计各地区在某一时间段内的发案数,系统通过使用Axis的渲染绘图功能,实现结果的柱状图等图形显示。

系统实现地区发案率分析过程如下:

⑴ 当用户提交相应时间的请求数据后,通过声明属性renderTo:document.body实时渲染标明图表;

⑵ 后台接收到前台的请求后,调用dao层的getRate()方法获取当前数据库中发案率统计信息;

⑶ 后台获取到查询结果之后,将该结果组装成JSON数据发往前台。

由于该分析查询是一个聚类查询,系统使用标准的SQL语句获取发案率的统计信息,返回一个list对象,再对这个对象进行操作,显示相应的柱状图,使得分析比较功能的实现更加方便与简单。

2.2.2 分析结果的Excel导出

系统还实现了将分析结果保存到Excel文件的功能,具体实现的过程如下:

⑴ 当用户点击“保存分析”按钮之后,提交saveAnalysis请求给后台;

⑵ 后台Spring MVC获取到该请求后,调用对应ExcelBuild中的Excel方法进行处理;

⑶ 该方法调用ExcelUtil类的静态方法writeExcel,把要写入的数据封装成对象数组,完成Excel文件的写入操作,将Excel文件保存到指定路径。

基于地区统计发案数据的分析比较结果如图3所示。

3 结束语

面向数字城管领域的数据分析与挖掘是数字化城市管理建设提升的重要手段,可以为城市管理工作者提供科学有效的决策支持。本文在介绍数字城管建设现状的基础上,设计了一个基于Java EE技术平台、结合Spring和Hibernate框架、符合主流MVC架构的面向数字城管的数据分析与挖掘系统。该系统综合利用统计分析方法和范例推理技术,实现了业务数据的有效分析,并提供分析结果的图形化显示,能为城市管理的科学决策提供直观的依据。今后,将继续扩展系统的数字城管信息来源,引入更加智能的数据挖掘算法,进一步促进数字化城市管理应用的知识发现。

参考文献:

[1] 孙峰.数字城管业务系统建设初探[J].电脑知识与技术,2009.5(24):6707-6711

[2] 郝力.数字城管:革新城市管理模式[J].建设科技,2010.23:20-22

[3] 陈观林,李圣权,周鲁耀.杭州市“数字城管”现状及发展对策研究[J].情报杂志,2009.28(z2):43-45

[4] 郭喜安.数字化城市管理相关技术的应用与创新[J].城市发展研究,2009.16(7):11-12

[5] 刘东坡,刘法能.空间分析技术在数字城管系统中的应用[J].电脑知识与技术,2009.5(4):984-985

数据分析设计范文第10篇

【关键词】 大数据; 数据分析法; 管控机制

随着物联网等信息技术的发展,大数据时代已经来临。数据要经过有目的性的分析才能转换成为资产。否则,企业要花费成本收集数据、分析数据与存储数据。数据分析型企业的本质是建设以事实为依据,数据分析为量化手段进行经营与管理的企业。因此,企业会计大数据分析就是以会计大数据的获取、存储、计算与可视化等数据分析的作业流程为主线,确保数据来源和数据质量的可靠性和真实性,数据分析结果的合理性、准确性和有效性。但是由于这个作业流程都是建立在网络有效、可信运行基础上,必然会产生难以预测的风险。也就是说,如果建设数据分析型企业过程中没有处理好商业秘密的保护、数据质量的安全、数据人为操纵、数据垄断等风险,数据分析型企业建设所具有的优势将不复存在。正是基于这种认识,分析构建会计大数据分析型企业的核心风险,并对其进行揭露,以及从机制设计的角度提出管控机制。

一、风险揭露:构建会计大数据分析型企业的核心风险

(一)商业秘密与个人隐私暴露在“第三只眼”的风险

由于网络的虚拟化、无边界、流动性等特征,数据及其系统面临较多的安全问题——黑客入侵、恶意代码攻击、拒绝服务攻击、网络钓鱼或敏感信息外泄等。具体的表现:

1.数据或系统被第三方攻击而不能够应用,网络中的病毒、木马、恶意软件对公司的数据或系统的监测、攻击,导致公司的数据或系统不能够正常运转与应用。

2.商业机密与个人隐私暴露在“第三只眼”。商业机密是企业的生命线,不能够被第三方所利用。商业机密与个人隐私的数据在网络、服务器、存储、平台到应用的过程经常被第三方窃取和泄露。特别是公司内部员工恶意利用实体的方式,接触备份敏感数据,或是利用在系统上的权限,存取第三数据,窃听重要会议机密,获取商业机密。

3.商业机密或个人隐私的数据会被别有用心的人“恶意”利用。黑客以及公司的恶意员工等第三方利用病毒、木马、恶意软件窃取公司的数据进行恶意使用,以获取非法商业利益,从而伤害到公司的利益。

4.系统内部自然、人为因素导致数据或系统不能够正常运作。由于火灾、地震等自然因素,或硬件与软件运行过程的正常与不正常因素,导致数据或系统不能够正常运作。这就要提高系统的容灾备份机制,重要的系统、异地容灾备份。建立完善的应急响应机制,提高异常情况和突发事件的应急响应能力。

(二)数据质量问题导致数据的误用

“与有形产品不同,垃圾的数据只能产生垃圾的信息。”由于在大数据过程中经常出现数据不准确、不完整、不及时等数据质量的问题,因此,在数据分析处理的过程中必须确保大数据的质量,大数据的质量主要有大数据的准确性、完整性、一致性、时效性、可信性、可解释性等。数据的准确性是指不包含错误或存在偏离期望的值;数据的完整性是指数据不缺属性值,或仅含聚集数据;数据的一致性是指数据之间不存在差异,相互可内洽;数据的时效性是指数据的及时性;数据的可信性是指反映有多少数据是用户依赖的;数据的可解释性是指数据是否容易理解。

(三)数据被人为操纵的风险

数据分析的目的是解决企业业务问题、提升业务决策有效性。由于业务的理解因人而异,业务决策的目标也因人而异。数据分析所应用的数据、模型不同、数据分析的结果将也会因人而异。也就是说,数据分析如果不能够客观,将会产生被人为操纵的风险。一方面,由于人认知能力的有限性,人对数据的理解、对数据反映业务的理解、数据分析模型的选择,甚至数据分析结果的理解等各个方面,会导致数据分析被人为无意识所操纵;另一方面,由于人经济利益的驱动,数据分析必须被经济利益所操纵。错误的前提导致错误的结论。”有时由于数据质量不佳而导致错误的结果,而大部分是由于误用了数据分析的结果。曾经担任英国首相的本杰明·迪斯累里曾经说过,“世上有三种谎言:谎言、可恶的谎言和统计数字。”数据分析在不诚实的人手里有可能被滥用。因此,企业必须杜绝那种自私的操纵统计数据的做法,并增强注重客观性的企业文化。

(四)数据独裁的风险

IBM公司在东京的办事处上有一个标语:“计算机: 迅速 精确 愚蠢;人:缓慢 粗心 聪明。”计算机有许多优点,但它毕竟不能够取代人。同样,数据及其数据分析有许多优点,但不能够走向极端,为数据而数据,为量化而量化。除了由于数据的质量问题,数据分析错误或误导外,数据有可能根本达不到量化的目的。由于对数据的过分执迷,从而导致赋予数据过多的信任。一方面,数据根本不能够被完全、充分的收集,或者说收集到完全、充分的数据的成本非常大,或耗费的时间非常长。而等到收集到数据早已错过决策的最佳时间。这也就是“机不可失,时不再来”的道理。数据的分析大多是基于相关性的分析,而不是基于因果关系的分析。卓越的才华并不依赖于数据。虽然由于人类独有的弱点、错觉等第一系统的决策需要数据的分析来提升,但是,人类的冒险精神、创造力、直觉和天赋却是数据分析所不能够比拟的。因此,数据的分析要与具有远见卓识的天赋相结合。

二、机制设计:数据分析型企业建设的制度保障

针对上述数据分析过程中所暴露出的风险,可以从人的角度、技术的角度来设计制度,规避风险。这里从人的角度来设计数据分析过程的机制设计。而数据安全等技术制度将在其他文章中详细讨论。

“机制”一词最早源于希腊文,原指机器的构造和动作原理,后被引入到生物学、医学、经济、社会、管理等领域,如经济机制、管理机制等。机制一般泛指系统内部的有机制约关系及其运行机理。在借鉴Hayek(1945)将不同组织视为信息交流系统基础上,Hurwicz(1960)把机制视为一个信息交流系统。作为信息交流系统的机制设计,Hurwicz、Eric S.Maskin和Roger B.Myerson开创了经济机制设计理论①。机制设计理论应用大到对整个经济制度的一般均衡设计,小到对某个经济活动的局部均衡设计。至今,机制设计被应用于经济组织设计、计划、委托—理论、契约理论、规制理论、最优税制设计和社会选择理论等。

机制设计的功能与意义可以用简单的例子来说明。母亲给孩子分一个苹果,也不管母亲是如何公正,孩子都会认为,母亲所分的苹果不公正。因为,人的心里因素的作用,每个孩子都会主观地认为,另外一个孩子所得的苹果比自己的大。而如果让一个孩子分苹果,却让另外一个不分苹果的孩子先拿苹果。那么,这样的分苹果机制,自然就公平了。因此,本项目将吸收机制设计理论,来设计解决数据分析过程中所披露的人为风险。

解决数据分析过程风险的机制设计将遵循成本最低、风险规避最好的原则来设计。具体的机制主要有:在数据收集阶段针对控制数据质量风险的机制是“从事业务,谁承担数据质量”、数据分析阶段针对促进数据分析的机制是“谁主张、谁举证”;在数据应用阶段针对数据被人所操纵及数据所滥用的机制是“谁使用,谁负责”。具体如下:

1.数据收集阶段:谁从事业务,谁承担收集相应业务的数据并保证数据质量

数据来源于业务。只有足够多或丰富的数据,才能够进行数据分析;只有真实全面的数据,才能进行数据分析;只有可信的数据,才有必要进行数据分析;如何保证企业低成本采集到足够丰富的数据、数据的真实与可靠机制就是谁从事业务,就承担收集相应业务分析数据并保证数据质量。因为,只有从事业务的人熟悉该业务的数据,收集起来相对方便,也能够知道所收集数据的质量。

2.数据分析阶段:谁主张,谁举证

数据分析的目的是使用数据尤其是量化数据来为决策者提供决策所需要的事实或信息。因此,在数据分析阶段针对促进数据分析的机制是“谁主张,谁举证。”

“谁主张,谁举证”就是说,方案的提议者负责提供事实证据来支持决策。方案提议者负责在形成提案的过程中,从各种渠道收集数据,及时地分析数据和信息,并形成方案的提案。在决策过程中,提议者关心可能的提案及其合理性,需要对提案进行数据分析来提供充分的、及时的信息,并利用这些信息快速验证各种设想的合理性并对可能的后果作出预估。

3.数据应用阶段:谁使用,谁负责

为了防止数据被滥用和数据的二次利用所带来的商业机密或个人隐私暴露在“第三只眼”等风险,在数据应用阶段所设计的机制是“谁使用,谁负责”。

传统对财产采用“接触许可”制度可以杜绝财产的滥用和机密的泄露。保护财产的责任在于所有者或财产的拥有者。但是,在信息社会中,数据的收集及首次利用并不能够知道数据在将来会如何被二次及再次利用,如何利用,用于什么目的等。因此,传统对数据的“接触许可”制度已经不适应大数据时代的实际情况。为了防止数据被滥用和数据的二次利用所带来的商业机密或个人隐私暴露在“第三只眼”等风险,将责任从数据所有者或拥有者转移到数据使用者上很有意义,也存在充分的理由。因为,只有数据使用者才能比任何人都明白他们想要如何利用数据。数据的使用者是数据二次应用的最大受益者,这就理所当然应该对他们自己的行为负责。

【参考文献】

上一篇:毕业设计教学范文 下一篇:数学拓展知识范文