医学论文中定量资料统计分析方面的错误辨析与释疑

时间:2022-05-21 07:15:30

医学论文中定量资料统计分析方面的错误辨析与释疑

【关键词】 统计学; 医学; 论文; 统计分析; 非参数统计

1 问题的提出

在医学论文或稿件中,若观测结果是定量资料,常需要在不同实验条件下比较其平均值之间的差别是否具有统计学意义,此时,称为定量资料的统计分析。如何才能正确地实现定量资料的统计分析呢?关键是两点:其一,检查定量资料是否满足参数检验的前提条件;其二,正确辨析定量资料所对应的实验设计类型。第一点常可通过统计软件来实现,而第二点则需要分析资料的人具有这方面知识,才有可能合理选择统计分析方法。然而,只要科研课题涉及到两个或两个以上因素时,实际工作者能正确判定其实验设计类型的场合少得可怜,因此,在医学论文或稿件中,这方面的错误不计其数。概括起来说,不外乎有以下两类错误:(1)当定量资料不满足参数检验的前提条件(独立性、正态性和方差齐性)时,盲目套用参数检验方法(通常为特定设计下定量资料的t检验或方差分析);(2)不管定量资料对应的实验设计类型是什么,一律套用单因素两水平(或叫成组)设计定量资料的检验方法(如t检验或秩和检验)或单因素多水平设计定量资料的分析方法(如单因素多水平设计定量资料的方差分析或秩和检验)。其结果是所得出的结论可信度低,甚至是错误的[1,2]。

2 中西医结合治疗实例

例1 某临床医生收集了如下的资料(表1),在各组内进行配对设计定量资料的t检验,在任何两组之间,用差量进行成组设计定量资料的t检验。请问:错在哪?正确的做法是什么?

对差错的辨析与释疑 原作者的做法是错误的!因为这样做割裂了整体设计,每次分析时,仅用了部分数据,数据的利用低,自由度小,结论的可信度低;无法分析药物种类与测定时间之间的交互作用。正确的做法是:先检查资料是否具备参数检验的前提条件,然后正确判定资料所对应的实验设计类型。假定本例中的定量资料满足参数检验的前提条件,而实验设计类型表面上看是“4个自身配对设计”同时存在,应叫做“具有一个重复测量的两因素设计(其中,测定时间因素与重复测量有关,除此因素之外,还有一个‘药物种类’因素)”。正确的统计分析方法为“具有一个重复测量的两因素设计定量资料的方差分析”。对本例而言,更合适的分析策略是:将“治疗前”视为“协变量”,即设法使各药物组治疗前尽可能取相等的平均水平,从而推算出治疗后的平均测定结果(称为校正的平均值),提高各药物组之间的可比性,其统计分析方法叫做“单因素4水平设计定量资料的一元协方差分析”(每次只分析一个定量指标);若每次需要同时分析3个定量观测指标,其统计分析方法可叫做“带有一个协变量的单因素4水平设计定量资料3元方差分析”。

表1 各组治疗前后肝功能检测结果比较(略)

例2 很多人用成组设计定量资料的t检验和单因素多水平设计定量资料的方差分析处理表2资料。请辨析:这样做错在哪里?为什么?正确的统计分析方法是什么?

表2 两组不同组织类型的NSCLC肺部ROI的Max SUV和Mean SUV比较(略)

对差错的辨析与释疑 表2中最后两列为两个定量的观测指标,原则上,当实验中涉及两个或两个以上定量指标时,看专业上是否需要同时考察它们的变化,若不需要,就视为两个一元定量资料;若需要,就视为一个二元定量资料。关键是检查资料的前提条件(此处从略)和正确判定定量资料所对应的实验设计类型,以下就不再赘述了。原作者所用的两种统计分析方法都属于分析单因素设计定量资料的统计分析方法,是不正确的。属于未正确辨析实验设计类型,就盲目套用统计分析方法的一种坏习惯,其结论是不可信的。该定量资料中涉及两个实验因素,一个是中医上的分型(非血瘀证与血瘀证),另一个是癌细胞类型。两个因素共有6种水平组合,各组合下都有一组独立的患者,两个因素同时出现在实验中,尚无专业知识保证它们对观测指标的影响谁是主要或次要,故这个定量资料所对应的实验设计类型应叫做两因素析因设计或叫2×3析因设计,当定量资料满足参数检验的前提条件时,以选用相应设计定量资料的方差分析处理为宜。例3 很多人用成组设计定量资料的t检验和单因素多水平设计定量资料的方差分析处理表3资料。请辨析:这样做错在哪里?为什么?正确的统计分析方法是什么?

表3 两组不同分期的NSCLC肺部ROI的Max SUV和Mean SUV比较(略)

对差错的辨析与释疑 原作者所用的两种统计分析方法都属于分析单因素设计定量资料的统计分析方法,是不正确的。属于未正确辨析实验设计类型,就盲目套用统计分析方法的一种坏习惯,其结论是不可信的。该定量资料中涉及两个实验因素,一个是中医上的分型(非血瘀证与血瘀证),另一个是疾病分期。两个因素共有8种水平组合,各组合下都有一组独立的患者,两个因素同时出现在实验中,尚无专业知识保证它们对观测指标的影响谁是主要或次要,故这个定量资料所对应的实验设计类型应叫做两因素析因设计或叫2×4析因设计,当定量资料满足参数检验的前提条件时,以选用相应设计定量资料的方差分析处理为宜。例4 很多人用成组设计定量资料的t检验和单因素多水平设计定量资料的方差分析处理表4资料。请辨析:这样做错在哪里?为什么?正确的统计分析方法是什么?

表4 各组肺组织病理图像分析结果比较(略)

对差错的辨析与释疑 原作者所用的两种统计分析方法都属于分析单因素设计定量资料的统计分析方法,是不正确的。属于未正确辨析实验设计类型,就盲目套用统计分析方法的一种坏习惯,其结论是不可信的。该实验共有8个实验组,每组中的10只动物都在三个区被检测某定量指标的结果,故“三个区”是与重复测量有关的因素。要判断该定量资料所对应的实验设计类型,关键是要弄清“组别”是一个实验因素还是一个复合因素。显然,“组别”中涉及到很多因素,如“是否建模”、“是否用药”、“用何种药”、“用药种数”,这4个因素每个至少有2个水平,全面组合至少应有16个小组,现在只有8个组,说明这些因素的水平未全面组合,属于“多因素非平衡组合实验”,而不是一个标准的多因素实验设计。对于这种定量资料,应对“组别”进行合理拆分。可能的拆分结果如下。组合1:正常对照组与模型组;组合2:模型组、丹参组、黄芪组、雷公藤组、氢化考的松组、硫唑嘌呤组;组合3:模型组、雷公藤组、硫唑嘌呤组、硫唑嘌呤+雷公藤组。将上述三种组合分别与三个区同时考虑,构成不同的实验设计类型,具体地是,组合1叫做“具有一个重复测量的两因素设计”,其设计格式见表5。

组合2也叫做“具有一个重复测量的两因素设计”,其设计格式见表6。

表5 两组肺组织病理图像分析结果比较(略)

表6 各组肺组织病理图像分析结果比较(略)

组合3应叫做“具有一个重复测量的三因素设计”,因为该组合中的4个实验分组本身形成了一个2×2析因设计结构,再加上与重复测量有关的因素“三个区”,其结构用统计表表达出来(表7),便可一览无余,层次清晰,易于辨析

其真正的实验设计类型。

表7 4组肺组织病理图像分析结果比较(略)

例5 很多人用配对设计定量资料的t检验和单因素多水平设计定量资料的方差分析(两两比较用LSD法)处理多因素影响下的定量资料,如本刊2006年第4卷第3期第287页上的表1资料(为节省篇幅,详细资料此处从略)。请辨析:这样做错在哪里?为什么?正确的统计分析方法是什么?

对差错的辨析与释疑 在此资料中,第1列“Group”之下的5个组不是单因素5水平之间的关系,它是多因素非平衡组合实验,因此,需要对“Group”进行合理地“拆分”:如组合①,前4组可同时比较;组合②,“第1组,第2、3、4三组中取一组,第5组”可同时比较。还应考虑放置在表中纵向上的“时间”因素,第1个时间点为“处理前”,应将其视为“协变量”,而且,“时间”是与重复测量有关的因素,简称重复测量因素。同时考虑某种组合和时间,则分别与组合①、组合②对应的统计分析方法都叫做“具有一个重复测量的两因素设计定量资料的一元协方差分析”。

【参考文献】

1 Hu LP, Li ZJ. Fundamental of medical statistics and discrimination of typical misuse. Beijing: Press of Military Medical Sciences. 2003: 149153. Chinese.

胡良平, 李子建. 医学统计学基础与典型错误辨析. 北京: 军事医学科学出版社. 2003: 149153.

2 Hu LP. Application of tripletype theory of statistics in experimental design. Beijing: People's Military Medical Press. 2006: 139165. Chinese

上一篇:“安全困境”概念辨析 下一篇:违反成立未生效合同责任辨析