Excel数据分析软件在医药统计中的应用

时间:2022-09-22 09:28:40

Excel数据分析软件在医药统计中的应用

【摘要】 Excel是办公室自动化中非常重要的一款软件,它不仅仅能够方便地处理表格和进行图形分析,其更强大的功能体现在对数据的自动处理和计算上,本文主要讨论Excel的“数据分析”统计分析工具包工具在医药数据统计上的一些应用。 【关键词】 数据分析;描述统计;检验分析;方差分析

1 引言

Excel提供了一组强大的数据分析工具,称为“分析工具库”,使用分析工具库可以在用户建立复杂统计或工程分析时节省许多操作步骤。但由于“分析工具库”中的分析工具具有很强的专业性,一般在统计学或工程学的特定领域应用得比较广泛,因此普通的Excel用户对此“分析工具库”工具都采取了一种敬而远之的态度,很少有用户使用Excel的“分析工具库”功能及其提供的内容丰富的函数。其实在Excel的“分析工具库”中包括了许多非常实用的函数,利用这些函数可以帮助我们方便地解决许多Excel实际应用中的难题。

Excel以其简便易学已为大多数研究人员所掌握,其中的“分析工具库”能做一些常用的统计处理,我们只要针对实际问题找到对应的分析工具就可以了。

鉴于Excel具有强大的数据处理与统计功能,而在药学研究中,血药浓度的计算、药动学参数的求解、给药方案的设计、数据设计及组织管理、绘制图表等,需要进行大量而繁琐的数据处理、绘制各式图形。在医学数据的处理上,数据的统计缝隙也是非常重要的。电子表格处理系统Microsoft Excel for Windows是具有强大的数据处理及管理、图表绘制和打印等功能的软件,该系统操作简单,提供数据的动态显示和报告,数据分析工作直观,图表与Word等字处理软件兼容性好,能相互切换,可以方便地用于医学和药学研究的数据处理。

2 数据分析工具的应用

2.1 描述统计 “描述统计”分析工具用于生成源数据区域中数据的单变量统计分析报表,提供有大数据趋中性和离散性的综合信息[1]。

2.1.1 示例 某医院用中药治疗青光眼的试验中一些患者眼压的变化,用“描述分析”对这组数据进行基本的统计分析。

2.1.2 操作步骤 因为改统计分析软件操作界面比较简单直观,只要按照题目的要求填写相应的数据即可得到所需的结果,这里就不再赘述了。输入界面如图1所示。图1 “描述统计”输入操作界面(略) 汇总统计结果可以包含:平均值、标准误差(相对于平均值)、中值、众数、标准偏差、方差、峰值、偏度、极差(全距)、最小值、最大值、总和、总个数、最大值(#)、最小值(#)和置信度[2]。

2.1.3 结果分析 如图2所示,输出了实验数据所需的各种统计结果,以备医务工作者分析患者的病情。 图2 描述统计分析结果(略)

2.2 t检验 实际工作中,除需要判断某种处理结果与某一已知结果间的差异外,还需比较两种处理的效果,即比较两个样本总体的统一参数的差异。本节将讨论Excel“统计分析”工具包中的t检验。适用于等方差、异方差和成对数据的情况。

2.2.1 t检验 双样本等方差假设。等方差假设这个分析工具可用来确定等方差的两个样本均值是否相等或均值差是否等于给定值。

示例:考察一组成年男女体重的数据进行检验分析。要求用t检验来验证两组体重数据的均值差是否为20。

2.2.2 操作过程 打开t检验工具的对话框,按要求填入相应的检验参数,如图3所示。 图3 t检验:双样本等方差检验(略)

2.2.3 结果分析 统计分析结果如图4所示,从中可以得出分析结果为T统计量(0.020046449)小于双尾临界值(1.972016435),也小于单尾临界值(1.652585979);而相应的双尾概率高达0.984026506,单尾概率也达到0.492013253。所以可以有把握地认为均值差等于给定值20。

2.3 方差分析 方差分析是数理统计中重要的组成部分,在统计实践中也有着广泛的应用。由于方差分析的运算量随着变量的增多呈几何级数增长,如果不使用计算机,很难完成大规模数据的方差分析。在应用统计学的几个主要领域里,方差分析也是惟一无法直接用Excel 2002中的函数完成的科目(当然,如果耐心地对每组数据逐个进行计算,也可以用函数实现,但繁重的运算会使得工作效率变得很低,错误率增大)。

方差分析主要分为单变量方差分析、无重复双变量分析和有重复双变量方差分析。Exce1 2002在“统计分析”工具包中就对应地提供了这三个工具。下面仅介绍单因素方差分析。

单因素方差分析的作用是通过对某一因素的不同水平进行多次观测,然后通过统计分析判断该因素的不同水平对考察指标的影响是否相同。从理论上讲,这实质上是在检验几个等方差正态总体的等均值假设。单因素方差分析的基本假设是各组的均值相等。

2.3.1 示例 进行某化学合成反应时,为了解催化剂对收率是否有影响,分别用5种不同的催化剂独立地在相同条件下进行试验,每种催化剂实验4次,要求用方差分析判断催化剂对收率是否有影响[3]。

这是一个典型的单因素方差分析问题,催化剂是一个因素,而不同的催化剂可以视作该因素的不同水平。

2.3.2 操作过程 将原始数据输入工作表,打开单因素方差分析对话框,按要求填写选项。

2.3.3 结果分析 统计分析结果如图6所示,从中可以得出分析结果为

运算结果分成概要和方差分析两部分。

概要:返回每组数据(代表因素的一个水平)的样本数、合计、均值和方差。

方差分析:返回标准的单因素方差分析表,其中包括离差平方和、自由度、均方、F统计量、概率值、F临界值。

分析组内和组间离差平方和在总离差平方和中所占的比重,可以直观地看出各组数据对总体离差的贡献。将F统计量的值与F临界值比较,可以判定是否接受等均值的假设。其中F临界值是用 FINV函数计算得出的。本例中F统计量的值是10.34346,远远大于F临界值3.055568。所以,拒绝等均值假设,即认为5种催化剂的对收率差异有显著性。从显著性分析上也可以看出,概率为0.000317,远远小于0.05。因此也拒绝零假设。

3 讨论

数理统计方面的软件应该说目前为止比较流行的软件也有一些,如SPSS、SASS、STATISTICA等等,但这些软件一是专业性比较强,艰深难懂,操作起来比较麻烦,且基本上是英文版的,对于一般人来讲还使用起来会觉得不方便的,二是软件价格过于昂贵[4]。

Excel是微软公司出品的办公系列软件,是很多人非常愿意使用的软件,所以它的普及程度比较高,即使是人们没有太多的使用Excel的许多高级应用,学习起来也会比其他的专业软件得心应手一些。

Excel中的“数据分析工具”智能地同步引用了多个统计函数对样本数据进行分析,可同时返回所希望的多个分析结果甚至图表,使医药工作者在进行科学研究及实验数据处理时不再忙于繁杂的数据计算过程,而更加专注于试验设计,计算(分析)结果的编辑打印则更便于资料的存档和交流。

本文只引用了几个应用Excel“数据分析工具”进行医药数据统计的实例,其实Excel“数据分析工具”还有好多种统计分析工具,它们能够进行非常复杂的统计计算,这种计算功能非常强大,如果采用人工计算会费时费力,得不偿失,比如,回归分析,方差分析以及各种检验统计分析等等。Excel友好的界面,清晰的统计分析结果,使医药工作者在使用Excel的“数据分析软件”时会感到非常的方便快捷,灵活实用。由于论文篇幅的限制,Excel“数据分析工具”的其他应用实例就不在这里赘述了。

【参考文献】

1 王晓民.Excel 2002高级应用—数理统计.北京:机械工业出版社,2003,214.

2 徐秉玖.药物统计学.北京:北京医科大学出版社,1999,6-7.

3 刘定远.医药数理统计方法,第3版.北京:人民卫生出版社,1999,156.

4 王文中.Excel在统计分析中的应用.北京:中国铁道出版社, 2003,1.

上一篇:谈如何开展学校中球队队员的选拔工作 下一篇:试析从结构化理论看功能主义欧洲一体化理论