医学统计学论文范文

时间:2023-03-22 18:50:26

医学统计学论文

医学统计学论文范文第1篇

众所周知,医学是理论性、实践性很强的学科。医学统计学更是一门既有复杂理论知识,又有丰富应用技巧的医学专业基础课程。它是科研设计、资料的搜集、整理和分析的灵魂,应用于居民健康状况评价、医疗卫生实践和医学科研,涉及基础医学、临床医学、预防医学等多学科领域。其教学内容贯穿于研究设计到论文撰写的全过程。如何适应新形势,迅速推广医学统计学的基础知识,在满足医学科研需要的同时实现医学统计学的自身发展,是医学统计教育面临的重要课题。我国医学统计教育面临的主要问题是:①教学对象的数学基础普遍较差,教学手段落后。②医学研究进一步向宏观和微观发展,信息数据更加复杂化、多元化和大数量化。我们利用多媒体计算机辅助教学CAI系统具备较好的独立性、可参与性与知识的全面、系统性,以及多媒体组合的高效性等诸多优点,解决了上述问题。利用多媒体技术,我们可以让学生做到“所学即所见、所闻即所学”,适当拓宽内容的深度和广度,提高灵活性,大大增强学生的参与感和实践能力,以创造传统教学手段所达不到的效果。同时,还可利用计算机对学生的学习进行评估并决定进度,实现因材施教。

进入21世纪以后,信息技术飞速发展,现代统计工具从计算器发展到计算机为主,能应用相关的统计软件处理医学科研数据已成为必备的能力。否则,一方面有人不懂得选用正确的统计方法,使大量的信息和统计数据得不到有效的利用;另一方面又盲目使用计算机和统计软件,不管是什么研究类型的数据都简单地交给计算机处理,用计算机取代统计,势必造成大量统计方法的滥用和误用。医学研究的许多数据关系到病人的治疗、转归,甚至生死,统计方法的误用会导致严重的论理问题。我们利用计算机、统计软件、多媒体教学课件相结合,使课堂教学摆脱大量的繁琐演算的束缚,在单位时间内讲授的信息量将会大幅度增加。统计学教学不再是数据的罗列和公式的堆砌,而是研究设计的艺术和数据表达的艺术,并使学生体会到统计思维和推理的乐趣。

近年来我们进行了一些改革措施,取得了相应的成果,现总结如下:

一、积极申报院级教学研究立项的课题:

(1)医学统计学多媒体CAI教学系统的研究和应用(2001年)

(2)医学研究生统计学课程教学模式的改革(2002年)

(3)《心理统计学》多媒体课件的制作及题库的构建(2004年)

另外开了《医学科研数据管理与统计分析》选修课

二、进行了一系列的教学改革措施:

(1)教学内容上所进行的改革,具体做到了“四增三减”:减少了目前已无必要讲授的详细手工计算步骤与技巧;减少了复杂的公式推导,改为公式内涵的剖析;减少了部分浅显内容,改为自学或课堂讨论;增加了“实验设计和调查设计”;增加了“医学统计学软件使用”;增加了“多元统计分析”;增加了“医学统计应用错误的诊断”。

(2)在教学手段上进行了以下几方面的改革:建立了医学统计学多媒体CAI教学系统;开设了统计学电脑实验课;开设了“医学统计应用错误的诊断”讨论课。

(3)在考试内容和形式上的改革:着重考核医学统计学综合分析能力以及正确应用统计方法和纠正错误能力。不考死记硬背、公式和定理。

三、发表相关论文:

(1)医学科研论文中t检验误用分析皖南医学院学报2002,21(2)

(2)医学科研论文中x2检验误用分析皖南医学院学报(论文待发表)

(3)皖南地区中学生伤害危险因素的病例对照研究,中华流行病学杂志,2003,24(7)

(4)胆石病病因的临床流行病学研究现代预防医学2001,28(4)

四、编写的教材:

(1)《医学科研方法与临床流行病学》(2003.8,安徽大学出版社)

(2)《预防医学》(第2版)(2003.8,人民军医出版社)

(3)《心理统计学》(2004.8,安徽大学出版社与北京科学技术出版社)

(4)《心理评估学》(2004.5,安徽大学出版社与北京科学技术出版社)

(5)《卫生统计学实习指导》(2003.10,安徽大学出版社)

(6)《流行病学实习指导》(2002.8,中国科学技术大学出版社)

五、成果创新点:

(1)将统计学软件、多媒体教学模式首次引入我院医学统计学教学之中;

(2)将统计思维和科研创造性实践相结合,注重学生科研能力的培养;

(3)改革了医学统计学的教学内容、教学手段、考试方法;

(4)首次在我院学生中开设“医学科研统计应用错误的诊断”讨论形式的教学模式

(5)特别注重教师主导作用与学生能动性统一

(6)编写“医学统计学”相关教材

六、成果应用情况:

(1)已经将改革的内容应用于我院专科生、本科生和硕士生的“医学统计学”;

(2)在本科生和硕士生的教学手段上采用“多媒体CAI教学”模式;

(3)在考试内容已作了相应的改革;

(4)已经将“医学科研统计应用错误的诊断”应用于皖南医学院学报的论文审阅之中。

医学统计学论文范文第2篇

1.1单因素方差分析(ANOVA)两两比较误用独立样本t检验单因素方差分析设计3组以上的均数比较,如果总体比较有差异,需进行两两比较,一般用SNK法或LSD法。但部分研究者却将资料进行拆分,应用独立样本t检验进行两两比较,导致第Ⅰ类统计学错误发生率(假阳性率)增加,从而掉进了一个常见的“统计陷阱”,使所得结论可信度大大降低甚至得出错误结论。SNK法与LSD法虽然并非等价,实质是一致的。SNK法一般用于经方差分析结果具有统计学意义时才决定进行的两两事后比较,而LSD法可用于方差分析不足以具有统计学意义时也能进行两两比较[1]。比较两种方法在SPSS的输出结果形式,SNK是“分堆”比较,一目了然,对于组别数较多的研究更为好用,但没有具体P值,而LSD是在进行“两两”比较时,能给出具体的P值。

1.2两两比较时检验水准的重新调定χ2检验或秩和检验3组以上整体比较有差异时,需应用分割法进行两两比较,这时检验水准应由原0.05调定为0.0167,否则会增加第Ⅰ类统计学错误的发生率。特别当P值处于0.0167~0.05时,按照P<0.0167的标准,差异无统计学意义,而按照P<0.05的标准,却有意义,与事实相悖,出现假阳性,很容易得出错误结论。这种分割法有时很保守,当行列表资料分组多且为有序时可用Mantel-Haenszel卡方检验,也称线性趋势检验(testforlineartrend)或定序检验(Linear-by-Lineartest)[2]。统计路径:用SPSS进行计数资料的趋势检验,在输出结果中读取线性关联检验统计量(Linear-by-LinearAssociation,LLA),如P<0.05可得出随着病种级别的升高,检测指标逐渐升高的趋势。

1.3临床诊断试验中的统计学方法应用在临床诊断试验研究中,经常选取单项计量指标或者联合计量指标以诊断某种疾病,若仅用初级统计学方法如t检验、单因素方差分析等往往不能有效挖掘信息,此时应采用受试者工作特征曲线(ROC)对检测结果进行分析评价。ROC曲线分析基本原理是通过诊断界点的移动[3],获得多对灵敏度和误诊率(1-特异度),以灵敏度为纵轴、误诊率为横轴,连接各点绘制曲线,然后计算曲线下的面积,面积越大诊断价值越高。ROC曲线很直观,能根据敏感性与特异性之和最大化原则自动产生最有效的诊断临界点。具体路径可以参考相关统计专著[3]。统计学处理一般描述为:采用SPSS(版次)统计软件分析数据,对单项及联合检测结果作图绘成ROC曲线,计算曲线下面积(AUC)和标准误,其中联合检测结果变量即预测概率由Logistic回归产生(也可以用判别分析得出)。计量资料应用-x±s表示,运用独立样本t检验及单因素方差分析,两两比较采用SNK及LSD法,计数资料采用χ2检验。检验水准为0.05。具体内容可据情而定。

1.4重复测量资料的方差分析误用拆分文件的t检验或方差分析如研究共设3组,每位患者在3个时间点均查某项血指标,部分作者在处理此类数据时,常误将纵向(同一时间点3组的比较)与横向(同组3个时间点的比较)数据均应用拆分文件的t检验或单因素方差分析来处理,结果导致统计学第Ⅰ类错误发生。此组数据实质是重复测量资料,应采用重复测量资料的方差分析。SPSS中的统计路径:数据-分析-一般线性模型-重复度量。研究者可以参考相关书籍进行处理[3]。

1.52×2析因设计及析因方差分析实验是2×2析因设计时,分组有两个因素,A与B,故分组为A、B、O、A+B,这个设计在析因设计研究中很常用,但常会出现分组设计正确,却没有用析因设计方差分析。析因设计与单因素方差分析不同[4],它不但能分析治疗效果中处理因素的单独效应和主效应,还能分析因素间的交互效应,并能提高检验效能。非统计专业的研究者进行析因分析可能稍有难度,可参考相关统计学书籍提供的统计步骤进行此类分析[3]。

1.6Meta分析Meta分析是循证医学系统评价常用的方法[5],应用时需注意统计学处理中计数资料采用比值比(OR)作为效应变量。具体路径:先进行异质性检验,当P>0.05时,认为同质,选择固定模型;P≤0.05时,不同质,此时可采用敏感性分析或分层分析等异质性处理,使之达到同质后再选择固定模型;若采用异质性处理仍未达到同质,则采用随机模型,以上统计路径均需交代清楚。Meta分析的结果是以“森林树”体现的,审校中我们经常遇到作者绘制的“森林树”左上角“文献、对比、结果名称”等内容显示为“?”,这是由于部分版本的RevMan软件不能输入中文,此时可以考虑省去,或用Photo-shop软件添加相应中文。Meta分析作为一种高级统计方法,专业性要求较高,作者可参考循证医学类权威杂志上的文章格式,如《中国循证医学杂志》中“论著•二次研究”栏目的循证文章。

2科技论文中统计学处理的相关表述

2.1资料与方法中具体统计路径的描述“统计学处理”的内容常位于论文资料与方法的最后一段,一般来说包括统计软件名称及版次、统计描述、统计方法、检验标准等内容,亦可细致交待每个表格的具体统计方法。经典例子如下,“统计学处理:采用SPSS(版次)统计软件分析数据。计量资料用均数±标准差表示,采用单因素方差分析,两两比较采用SNK法及LSD法。检验水准为0.05”。上述内容包括了大致的统计方法,即具体的统计路径。此部分内容,没有绝对统一的规定[6]。常见的问题有:统计学方法描述不全、内容过于简单、存在粘贴抄写痕迹等。如部分论文的统计学处理中提及“以α=0.05为检验水准,P<0.05为差异有统计学意义”这句话,这在统计学上实质是一个重复句,保留其一即可。

2.2结果中具体P值的标注现在的统计学处理手工计算的较少,一般均应用统计软件,最常用的软件如SPSS、SAS均能给出具体P值。但部分论文的结果表述中却未标明具体P值,作为科技论文是不够严谨的,建议作者在表述研究结果时注明具体P值,增加论文可信度的同时,可用于再次分析。

医学统计学论文范文第3篇

概率分布(probabilitydistribution)是医学统计学中多种统计分析方法的理论基础。授课内容一般包括:二项分布、Possion分布、正态分布、t分布、F分布等。

借助概率分布常常可以帮助我们了解生命指标的特征、医学现象的发生规律等等。例如,临床检验中计量实验室指标的参考值范围就是依据正态分布和t分布的原理计算得到;许多医学试验的“阳性”结果服从二项分布,因此它被广泛用于化学毒性的生物鉴定、样本中某疾病阳性率的区间估计等;而一定人群中诸如遗传缺陷、癌症等发病率很低的非传染性疾病患病数或死亡数的分布,单位面积(或容积)内细菌数的分布等都服从Poisson分布,我们就可以借助Poisson分布的原理定量地对上述现象进行研究。

在生物信息学中概率分布也有一定应用。例如,Poisson分布可以用于基因(蛋白质)序列的相似性分析。被研究者广泛使用的分析工具BLAST(BasicLocalAlignmentSearchTool)能迅速将研究者提交的蛋白质(或DNA)数据与公开数据库进行相似性序列比对。对于序列a和b,BLAST发现的高得分匹配区称为HSPs。而HSP得分超过阈值t的概率P(H(a,b)>t)可以依据Poisson分布的性质计算得到。

二、假设检验

假设检验(hypothesis)是医学统计学中统计推断部分的重要内容。假设检验根据反证法和小概率原理,首先依据资料性质和所需解决的问题,建立检验假设;在假设该检验假设成立的前提下,采用适当的检验方法,根据样本算得相应的检验统计量;最后,依据概率分布的特点和算得的检验统计量的大小来判断是否支持所建立的检验假设,进而推断总体上该假设是否成立。其基本方法包括:u检验、t检验、方差分析(ANOVA)和非参数检验方法。

假设检验为医学研究提供了一种很好的由样本推断总体的方法。例如,随机抽取某市一定年龄段中100名儿童,将其平均身高(样本均数)与该年龄段儿童应有的标准平均身高(总体均数)做u检验,其检验结果可以帮助我们推断出该市该年龄段儿童身高是否与标准身高一致,为了解该市该年龄段儿童的生长发育水平提供参考。又如,医学中常常可以采用t检验、秩和检验比较两种药物的疗效有无差别;用2检验比较不同治疗方法的有效率是否相同等等。

这些假设检验的方法在生物实验资料的分析前期应用较多,但由于研究目的和资料性质不同,一般会对某些方法进行适当调整和结合。

例如,基于基因芯片实验数据寻找差异表达基因的问题。基因芯片(genechip)是近年来实验分子生物学的技术突破之一,它允许研究者在一次实验中获得成千上万条基因在设定实验条件下的表达数据。为了从这海量的数据中寻找有意义的信息,在对基因表达数据进行分析的过程中,找到那些在若干实验组中表达水平有明显差异的基因是比较基础和前期的方法。这些基因常常被称为“差异表达基因”,或者“显著性基因”。如果将不同实验条件下某条基因表达水平的重复测量数据看作一个样本,寻找差异表达基因的问题其实就可以采用假设检验方法加以解决。

如果表达数据服从正态分布,可以采用t-检验(或者方差分析)比较两样本(或多样本)平均表达水平的差异。

但是,由于表达数据很难满足正态性假定,目前常用的方法基于非参数检验的思想,并对其进行了改进。该方法分为两步:首先,选择一个统计量对基因排秩,用秩代替表达值本身;其次,为排秩统计量选择一个判别值,在其之上的值判定为差异显著。常用的排秩统计量有:任一特定基因在重复序列中表达水平M值的均值;考虑到基因在不同序列上变异程度的统计量,其中,s是M的标准差;以及用经验Bayes方法修正后的t-统计量:,修正值a由M的方差s2的均数和标准差估计得到。三、一些高级统计方法在基因研究中的应用

(一)聚类分析

聚类分析(clusteringanalysis)是按照“物以类聚”的原则,根据聚类对象的某些性质与特征,运用统计分析的方法,将聚类对象比较相似或相近的归并为同一类。使得各类内的差异相对较小,类与类间的差异相对较大1。聚类分析作为一种探索性的统计分析方法,其基本内容包括:相似性度量方法、系统聚类法(HierarchicalClustering)、K-means聚类法、SOM方法等。

聚类分析可以帮助我们解决医学中诸如:人的体型分类,某种疾病从发生、发展到治愈不同阶段的划分,青少年生长发育分期的确定等问题。

近年来随着基因表达谱数据的不断积累,聚类分析已成为发掘基因信息的有效工具。在基因表达研究中,一项主要的任务是从基因表达数据中识别出基因的共同表达模式,由此将基因分成不同的种类,以便更为深入地了解其生物功能及关联性。这种探索完全未知的数据特征的方法就是聚类分析,生物信息学中又称为无监督的分析(UnsupervisedAnalysis)。常用方法是利用基因表达数据对基因(样本)进行聚类,将具有相同表达模式的基因(样本)聚为一类,根据聚类结果通过已知基因(样本)的功能去认识那些未知功能的基因。对于基因表达数据而言,系统聚类法易于使用、应用广泛,其结果——系统树图能提供一个可视化的数据结构,直观具体,便于理解。而在几种相似性的计算方法中,平均联接法(AverageLinkageClustering)一般能给出较为合理的聚类结果2。

(二)判别分析

判别分析(discriminantanalysis)是根据观测到的某些指标的数据对所研究的对象建立判别函数,并进行分类的一种多元统计分析方法。它与聚类分析都是研究分类问题,所不同的是判别分析是在已知分类的前提下,判定观察对象的归属3。其基本方法包括:Fisher线性判别(FLD)、最邻近分类法(k-NearestNeighborClassifiers)、分类树算法(ClassificationTreeAlgorithm),人工神经网络(ANNs)和支持向量机(SVMs)。

判别分析常用于临床辅助鉴别诊断,计量诊断学就是以判别分析为主要基础迅速发展起来的一门科学。如临床医生根据患者的主诉、体征及检查结果作出诊断;根据各种症状的严重程度预测病人的预后或进行某些治疗方法的疗效评估;以及流行病学中某些疾病的早期预报,环境污染程度的坚定及环保措施、劳保措施的效果评估等。

在生物信息学针对基因的研究工作中,由于借助了精确的生物实验,研究者通常能得到基因(样本)的准确分类,如,基因的功能类、样本归结于疾病(正常)状态等等。当利用了这些分类信息时,就可以采用判别分析的方法对基因进行分类,生物信息学中又称为有监督的分析(SupervisedAnalysis)。例如,基因表达数据分析中,对于已经过滤的基因,前三种方法的应用较为简单。而支持向量机(SVMs)和人工神经网络(ANNs)是两种较新,但很有应用前景的方法。

(三)相关分析

相关分析(correlationanalysis)是医学统计学中研究两变量间关系的重要方法。它借助相关系数来衡量两变量之间的关系是否存在、关系的强弱,以及相互影响的方向。其基本内容包括:线性相关系数、秩相关系数、相关系数的检验、典型相关分析等。

我们常常可以借助相关分析判断研究者所感兴趣的两个医学现象之间是否存在联系。例如,采用秩相关分析我们发现某种食物中黄曲霉毒素相对含量与肝癌死亡率间存在正相关关系;采用线性相关方法发现中年女性体重与血压之间具有非常密切的正相关关系等等。

生物信息学中可以利用相关分析建立基因调控网络。如果将两个不同的基因在不同实验条件下的表达看作是两个变量,相关分析所研究的正是两者之间的调控关系。如采用线性相关系数进行两基因关系的分析时,其大小反应了基因调控关系的强弱,符号则反应了两基因是协同关系(相关系数为正),还是抑制关系(相关系数为负)。

四、意义

生物信息学不仅是医学统计学的研究前沿,更是医学研究由宏观向微观拓展的重要领域,其研究内容已逐渐为多数医学院校的学员了解和熟悉。而如何对新技术产生的生物实验数据进行准确合理的分析,却成为生物信息学研究的主要瓶颈之一。

在医学统计学课堂教学中引入生物信息学实例,而不仅仅局限于常见的医学、卫生领域的例子,将难以理解的统计理论和方法与前沿的生物实例相结合,拓宽了学员的视野,提高了学员的学习兴趣,更可以加深对所学知识的理解;与此同时,使学员掌握了生物实验数据的先进分析方法,扩大了学员的知识面,提高了他们今后开展医学科研工作的能力。

还有一些医学统计学方法目前也逐渐应用于生物信息学研究中,诸如:遗传算法、熵理论等等。但这些方法已经超出了医学统计学课堂教学的范围,我们将尝试在第二课堂或选修课中,作为补充知识进行讲授,供那些学有余力的学员学习交流摘要:生物信息学的蓬勃发展已使医学研究由宏观逐步探索到微观。医学统计学作为一门医学院校的基础课程,其理论和方法在医学研究的新要求下其理论和方法也有了新的发展与应用。将生物信息学知识带入医学统计学课堂教学,介绍医学统计学的新发展,不但能使学员了解到本学科的前沿研究内容,有效地激发学员的学习兴趣,还能使他们掌握生物信息学研究的工具,提高今后从事医学科研工作的能力。

医学统计学论文范文第4篇

关键词:统计学;运动医学论文;体育类核心期刊

中图分类号:G80-32文献标识码:A文章编号:1006-7116(2010)11-0115-04

Analysis of statistical application errors in sports medical theses in

core journals in the sport category

ZHANG Ning

(Institute of Physical Education,Ningxia University,Yinchuan 750021,China)

Abstract: The author analyzed statistical application mistakes commonly seen in the writing of sports medical research theses in core journals in the sport category in recent years: 1)the division of experiment groups was irrational; the selection of testees violated the principle of homogeneity; 2)the comparison of the average of multiple samples was wrongly replaced with multiple t tests; single factor variance analysis was wrongly used for multiple factor variance analysis; statistical methods were irrational; 3)data type was wrongly judged, thus a wrong quantitative data statistical analysis method was used; the test of two sample rates was wrongly replaced with the t test of two samples.

Key words: statistics;sports medicine theses;core journals in the sport category

统计学是科学研究的基础,是研究结果科学性、可靠性的有力保障。而论文是研究成果的表达形式,通过论文可展示研究者的科研成果,也便于查阅者的了解、评价和引用。因此,在论文中要完整、准确地进行统计学内容的表述,以展示研究设计的合理性和研究结果的可靠性。但运动医学论文中存在的统计学错误仍相当严重,其中实验设计和统计资料的应用上最为突出。本文介绍论文中出现错误的部分,并对其进行了正确的统计学内容表述,以便供广大运动医学科研工作者参考。

1实验设计方面的问题

1)实验分组不合理。

例1:《有氧健身操结合饮食控制改善代谢综合征患者胰岛素抵抗、血脂、血糖的实验研究》[1]一文中研究对象为:西安市碑林区某社区代谢综合征患者77人年龄40~65(55.35±7.26)岁。按照接诊顺序将入选MS患者随机分为以下2组,综合干预组和对照组。

该文作者所选取代谢综合征患者年龄跨度较大(40~65岁),因为年龄的不同机能的代谢水平有很大的差异性,不能认为他们来自于同一个总体。把他们随机分入综合干预组和对照组参加试验,两组之间的可比性可能很差,其结论的可信度很低;如果,按年龄段分层随机化,组间的均衡性要高得多。

2)受试对象的选取违背同质性原则。

例2:《不同类型休闲活动对老年女性身体机能影响的差异性研究》[2]一文中对成都市老年大学、锦江区老年活动中心,随机选取离退休5年以上,年龄65~75岁之间老年女性为研究对象。并依据她们的年龄段将活动类型分为:为队、曲艺队、门球队、舞蹈队;测量指标为:血压及脉率,肺活量,椎体骨密度。

从一般的常识可知,经常参加体育锻炼的人有利于其血压及脉率,肺活量、椎体骨密度指标向好的方向发展。原作者所选取的活动类型为:、曲艺队、门球队、舞蹈。其中是一种智力游戏和身体运动没有什么关系,而曲艺,门球,舞蹈主要以身体运动为主(曲艺有利于人体的肺活量的提高)。所以原作者在试验设计时违背同质性原则[3]。

在实验设计时一定要遵守3大原则:对照、随机、重复。对照原则:要确定处理因素对实验指标的影响,如无对照是不能说明问题的。实验分组时有处理组和对照组。对照原则要求处理组和对照组除处理因素以外的其他可能影响实验的因素应力求一致(即齐同比较或有可比性)。随机原则:是使每个实验对象在接受分组处理时具有相等的机会,以减少偏性,使各种因素对各组的影响保持一致(均衡性好),通过随机化可减少分组人为误差。这是对资料分析时进行统计推断的前提。重复原则:是指可靠的实验应能在相同条件下重复出来(重现性),这就要求实验要有一定的例数(重复数)。因此,重复的含义是重现性与重复数。重现性可用统计学中显著性检验的值来衡量其是否满意[4]。

2定量资料统计分析存在的统计学错误

2.1多个样本均数比较错误应用多个t检验

例3:《有氧运动对大鼠血糖、血脂和血液凝固功能的影响》[5]一文中,将30只大鼠随机分为3组:对照组、小运动训练组和大运动训练组。对照组大鼠进行自由饮食和自由饮水;运动训练组动物在此基础上给予为期6周的游泳训练。有氧运动(游泳)、运动后2周和运动后4周从眼眶后静脉丛取血,以及实验结束时(运动后6周)断头取血,分别做血糖、血脂和有关凝血指标的测定。用SPSS统计软件对原始数据进行常规数理统计分析,计量资料用均数±标准差描述,显著性检验用t检验,P

这类错误是定量资料分析中最常见的错误,而且是原则性错误,会增加犯第一类错误的概率[6]。案例(原)表1资料为对照组、小运动组、大运动组不同有氧运动时间对大鼠血清LDL水平的影响,原作者用t检验分别对各组均数逐一进行比较。对照组大鼠在实验期间血清LDL水平没有明显变化P>0.05。与对照组相比,小运动组大鼠随着有氧运动时间的延长,血清LDL浓度逐渐降低,至第6周时,差异具有统计学意义P0.05,但与同期(第4周和第6周)小运动组大鼠血清LDL相比,差异具有统计学意义P

在应用t检验和方差分析时要注意它们之间的共性与区别。t检验和方差分析都是对总体(样本)均数的检验。当对两个以上的总体(样本)均数是否存在显著性差异进行检验时,如果用t检验,4个总体(样本)均数则需做c24=6次可能组合的检验。若在α=0.05的显著性水平上检验,则将降低统计结论效度。所以,两总体(样本)均数的检验用t检验,两个以上总体(样本)均数的检验用方差分析。

2.2处理多因素设计定量资料误用单因素设计定量资料的方差分析方法

例4:《不同营养干预对运动性贫血大鼠红细胞及铁代谢指标的影响》[7]一文中,实验目的为:观察补充复方阿胶中药与补充铁剂营养对运动性贫血大鼠红细胞及铁代谢指标的影响。方法:以32只健康雄性Wistar大鼠为研究对象,每只体重约300 g,随机分为4组,C组为安静对照组(n=8),E组为递增负荷跑台运动组(n=8),ENⅠ组为递增负荷跑台运动+阿胶营养补充组(n=8),ENⅡ组为递增负荷跑台运动+铁剂营养补充组(n=8)。然后ENⅠ组和ENⅡ组营养补充4周。实验结束后24h内处死。结论:9周递增负荷跑台运动导致大鼠红细胞相关指标的显著性下降,引起运动性贫血,但血液铁代谢无显著变化;补充4周复方阿胶中药制剂或铁制剂,提高红细胞相关指标,改善大鼠运动性贫血状况。数据统计方法实验数据用SPSS13.0软件中one-wayANOVA处理,结果用均数±标准差表示,显著性水平为P

原文采用单因素设计定量资料的方差分析不合适,仔细考察各处理组之间的关系有:是否递增负荷跑台运动,是否补阿胶营养或补铁剂营养(两者都能促进RBC生成,增加Hb含量的物质,在本研究中可以认为它们是同一因素),原文在固定一个因素于某个水平下观测另一个因素的作用,这种做法割裂了实验设计的整体性。正确的做法是,先从专业角度上分析二个实验因素之间是否存在交互作用、是否存在二个因素有主次之分、是否存在交互作用或交互作用可以忽略不计等情况。也就说对事物的影响只考虑施加了一个条件(因素)为单因素方差分析;如果施加了2个以上的条件(因素)为多因素方差分析。如果是多因素方差分析还要考虑施加的条件(因素)之间有没有联系、有没有主次之分。具体看(原)表2资料,施加了两个条例(因素)即递增负荷跑台运动和补阿胶营养或补铁剂营养,然后考虑两条件(因素)之间的联系,通过分析2个因素间存在交互作用的可能性比较大,应采用交互作用多因素方差分析处理此定量资料为宜。

2.3统计方法不合理,每一种统计方法都有其适用条件

例5:《高脂饮食对大鼠脂肪组织脂解调节因素的影响》[8],原文中采用单因素方差分析的LSD方法对(原)表3各组FFA浓度进行分析,得出结论具有统计学意义。

多个总体均数比较的方差分析,要求方差齐性。方差齐性实际上是指要比较的各组数据分布是否一致,通俗的说就是各组是否适合比较,一般的经验是如果在比较的各组中,如有一组的标准差是另一组的一倍时方差不齐性的概率较大。在做方差分析时,做方差齐性检验主要是确认数据的合理性(不具相关性)。对(原)表3数据进行方差齐性检验,可发现C组与OR组及OB组FFA浓度指标不能满足方差齐性的要求,故不能采用单因素方差分析的LSD方法。可以先进行对数、倒数或函数的转换,选择适当的转换形式,直到齐性检验变为不显著(不相关)。如果还不行就只能用非参数的单因素分析。

3定性资料统计分析方面存在的统计学错误

3.1误判资料类型,而误用定量资料统计分析方法

例6:题目:《传统体育对老年知识分子原发性高血压患者临床症状影响的观察研究》[9]原作者对原发性高血压,症状疗效评定标准是:头痛、眩晕、心悸、耳鸣、失眠、烦躁。各症状按症状轻重不同采用“半定量”计分法,按程度进行分级和计分,共分为4级:(“无”0分、“轻”1分、“中”2分、“重”3分),EH(原发性高血压)患者经6个月的传统体育锻炼实验,症状计分情况。治疗前后组内比较,除A组心悸、耳鸣、失眠症状外,3组均能改善老年知识分子EH(原发性高血压)患者临床症状(P

统计资料常常分为定量资料和定性资料两大类,所谓定量资料是指对每个观察单位用计量方法测量某项指标所获得的数值;如身高(cm)、血压(mmHg)、脉搏(次/min)、红细胞(104/mm-3)转氨酶(酶活性)等,都属于计量资料。而定性资料是指记录每个观察单位的某一方面的特征和性质[10]:如血型(A、B、O、AB)、职业(工人、农民、军人、学生)、性别(男、女),等等。本资料观察的是原发性高血压症状疗效,这里的0、1、2、3、4代表的是原发性高血压患者症状的轻重程度,属于定性资料中有序资料,(如:无、轻、中、重;治愈、显效、好转、无效、死亡),但原作者却错误地将其判断为定量资料,表的标题后括号内写 ±s的形式,表中给出也是平均数和标准差的数据。一般来说,t检验仅适于分析来自“单组设计、配对设计和成组设计”的定量资料,用分析定量资料的方法分析定性资料,显然是错误的。正确判定统计资料的类型是选用统计分析方法的首要前提[11]。本资料属定性资料,应根据分析目的,合理选用适合此类资料统计分析方法(如Riditi分析或者非参数检验秩和检验)。

3.2两样本率的检验误用两样本的t检验来代替

例7:《健身跑运动对中年人血脂异常者血脂、身体成分的影响》[12]一文中将所有受试者随机分成低强度组(L组)、中等强度组(M组)和对照组(C组)。数据统计数据用平均值±标准差形式表示。相关指标数据用t检验和多因素方差分析进行分析,P

运动医学研究离不开统计设计和统计学方法,如果选择错误导致结果有偏倚或结果原则性的错误,对运动医学的危害性较大。正确的统计分析是获得正确的科研结论的要素之一。只有明确资料的性质、试验设计类型、分析目的,掌握相关统计方法应用的前提条件,才能进行正确的统计分析。

参考文献:

[1] 郭汉,高晓华. 有氧健身操结合饮食控制改善代谢综合征患者胰岛素抵抗、血脂、血糖的实验研究[J]. 北京体育大学学报,2009,32(2):77-82.

[2] 王科峰. 不同类型休闲活动对老年女性身体机能影响的差异性研究[J]. 成都体育学院学报,2009,35(8):70-72.

[3] 潘发明,范引光,叶冬青. 卫生统计学教学形式和内容的拓展[J]. 疾病控制,2004,8(4):1-2.

[4] 赵书祥. 实用体育统计学[M]. 北京:北京体育大学出版社,2008.

[5] 章罗庚. 有氧运动对大鼠血糖、血脂和血液凝固功能的影响[J]. 北京体育大学学报,2009,32(7):66-68.

[6] 胡良平,刘惠刚. 定量与定性资料统计分析错误辨析(2)[J]. 外科理论与实践,2005,10(6):15-16.

[7] 薛统,高颀. 不同营养干预对运动性贫血大鼠红细胞及铁代谢指标的影响[J]. 北京体育大学学报,2009,32(8):62-64.

[8] 田吉明,汪军,王瑞元. 高脂饮食对大鼠脂肪组织脂解调节因素的影响[J]. 成都体育学院学报,2009,35(1):60-64.

[9] 汤庆华. 传统体育对老年知识分子原发性高血压患者临床症状影响的观察研究[J]. 北京体育大学学报,2009,32(2):67-69.

[10] 安胜利,统计学系列讲座(第8讲):基于秩次的非参数检验[J]. 护理学报,2006,13(9):94-95.

[11] 周素华,陆云霞. t检验和χ2检验常见误用辨析[J].公共卫生与预防医学,2007,18(2):110-111.

[12] 郑健荣. 健身跑运动对中年人血脂异常者血脂、身体成分的影响[J]. 北京体育大学学报,2009,32(7):56-59.

医学统计学论文范文第5篇

[关键词] 医学期刊 统计学问题 编辑

[中图分类号] G230 [文献标识码] A [文章编号] 1009-5853 (2013) 05-0067-03

医学统计学是一门以统计学原理和方法为基础,探索医学科研工作中遇到的有关数据的收集、整理和分析方法的应用科学,又可被看成一个收集信息、处理信息、分析信息,进而从中提炼和总结分析出新的信息的过程[1]。随着医学科研水平和医疗技术水平的不断提高,医学科研和临床实际工作中,人们对待科学的态度逐渐从原来的“经验主义”转变为“论据先行原则”,无论是在一些医学相关学科的基础实验中,还是在一些临床疾病的诊治等工作中,人们遇到问题时不再“想当然”,而是首先考虑为什么,有何依据,而这些依据大多需要通过统计学中的信息收集、整理、分析来提供。因此,医学统计学在医学工作中的地位越来越重要,统计学应用的正确与否直接影响着医学科研结论的科学性、严谨性和可靠性,具体到医学期刊方面,就会出现因统计学应用不恰当而导致医学期刊不严谨、不科学、不可靠和不具有影响力[2]。鉴于医学统计学在医学期刊中的重要地位,作者结合《肿瘤基础与临床》杂志2011年的240篇文章中出现的统计学问题,对目前我国医学期刊中常见的统计学问题进行分析,同时提出一定的解决方案,为医学编辑工作能力的提高以及医学期刊整体水平的上升提供一定帮助。

1 医学期刊中常见统计学问题

统计学的误用、错用和不用问题广泛存在于许多医学期刊中,统计学错误率处于较高水平,有文献报道期刊论文统计学错误率为38%—80%,而且统计学问题的种类几乎涉及统计学的每个方面,包括实验设计不合理、未进行统计学处理、统计分析软件未介绍或介绍不清、统计学数据的描述方法不当、统计学方法的描述不清或错用、统计值或P值不全或描述不清、统计学结果分析或描述错误等[3-4]。王倩等[5]对5种“中华”系列杂志刊登的文章的统计学应用进行回顾性分析,发现1985年统计学方法应用的错误率占24%,1995年占36%。沈进等[6]选取8种医学期刊,分析发表于1998年至2005年的544篇论著文章的统计学方法应用情况,结果显示,136篇的统计学出现明显错误,错误率达到25%,其中以资料处理方法不当所占比例最高,达到61.76%,其次为图表错误、未作统计学处理等。我刊2011年刊登的240篇论文中,排除个案报道、教学论文、棕色行论文36篇,剩余的204篇论文中有126篇论文采用了统计学处理,占61.76%(126/204),现结合本刊统计学应用现状针对医学期刊中常见的统计学问题进行分类分析如下。

1.1 统计研究设计不合理问题

大多数非统计学专业的学者在进行统计研究设计(包括实验设计、调查设计、临床试验设计)时仅仅从本专业的角度考虑,根据主观想要得到的结果进行分组设计,而完全没有考虑该实验设计的可行性、组间数据是否具有可比性等问题,主要表现在实验设计时不遵循随机化原则、未设置对照或对照不合理、均衡性原则贯彻不彻底等[7]。常见的统计研究设计不合理问题包括缺少对照或对照不合理、单因素设计取代多因素设计、样本量选择不具有代表性或样本量不足等[8]。例如,本刊《SMO蛋白及mRNA在食管癌鳞状细胞癌组织中的表达及意义》一文,在实验分组设计时未对各组间数据是否具有可比性进行统计学分析。

1.2 未进行统计学处理问题

许多医学期刊论文虽然也进行了分组设计、设立对照等,但是文中未说明采用何种统计方法,也未对这些数据进行统计学处理,仅仅通过对实验所得的实际数据的直观判断就得出结论[9]。例如,本刊《肺尖癌26例疗效分析》一文中,作者在分析不同治疗方法对肺尖癌的疗效时并未采用任何统计方法,而是直接得出了“综合治疗较单纯治疗更能延长肺尖癌患者生存期”的结论,这不符合现代医学科研的结论需有据而立的原则。

1.3 统计方法的描述不具体或错用问题

1.3.1 统计方法的描述不具体

一些医学期刊论文中列出的统计方法过于简单,甚至未列出,主要有以下几种情况[10-12]:在“材料与方法”部分中的“统计学处理”中未列出所用的统计学软件或仅列出所用软件而未说明所用软件的版本;对于何种数据采用何种统计方法仅笼统描述,未具体列出文中的那些数据应该用何统计方法;对于定量数据仅列出采取t检验或方差分析,而未列出是否进行正态性检验和方差齐性检验;对于两组定量数据无论是应该采用成组设计t检验还是配对设计t检验,均仅描述为“两组定量数据比较采用t检验”;对于两组或多组定性数据的比较,无论是仅需用 2检验,还是需要采用矫正 2检验或 2分割检验,均描述为“两组或多组定性数据的比较采用 2检验”;统计学符号书写不规范,例如,根据GB/T3358-82,F检验、P值、 2检验、t检验等中的字母应为斜体,不符合上述规定的书写均为错误情况,这在论文中非常普遍;未列出检验水准 ,检验水准 是事先设定的判断小概率实践的标准,实际意义是允许犯假阳性错误概率的最大值,需要根据不同的研究目的进行设定。例如,本刊《 -连环蛋白和层粘连蛋白的表达与垂体腺瘤侵袭性的关系》一文在“统计学处理”仅说明数据的比较采用t检验,而未说明t检验的类型。

1.3.2 统计方法的错用

一些医学期刊论文中的统计方法的应用存在明显的错误。对于所有定量数据,常见的错误有[13-14]:无论是否符合正态分布、是否方差齐,一律盲目应用t检验或单因素方差分析等参数检验方法进行比较分析;无论数据分为几组,一律采用t检验进行比较分析,把其当做定量数据比较的万能工具;无论各组数据是何关系,一律采用成组设计t检验或单因素方差分析。例如,本刊《癌症相关性乏力与TGF- 1的关系分析》一文中,定量数据进行比较分析之前未说明是否进行了方差齐性检验和正态性检验。对于所有定性数据,常见的错误有:把 2检验当做所有定性数据的万能统计工具,忽略了其应用的前提条件是, 2检验适用于正态分布的定性数据,且样本量最好>40,列联表数据进行 2检验时不能有1/5以上的格子其理论频数

1.4 统计结果的描述及分析错误问题

许多医学期刊论文中均可见到统计结果的描述或分析错误,常见的有以下几种[15-17]:1)对于定量数据应当根据是否符合正态分布而采用不同的描述方法,符合者一般采用“均数±标准差”或“均数±标准误”表示,而不符合者则采用中位数和四分位间距来进行表示,不按上述规定进行描述者均属于错误描述;2)对于定性数据,常见的错误是构成比和百分率不分,计算率或构成比等相对数的样本量过小;3)解释有统计学意义时仅根据P值的大小得出相应结论,例如对于A、B组2组的疗效(假定A组疗效优于B组),其“P

1.5 统计值和(或)P值描述不清以及统计值缺失问题

许多医学期刊对统计结果进行描述时,通常不能完整清晰地描述出统计值和P值,常见的有以下几种情况[18-19]:统计结果仅用“P0.05”得出结论,缺少相应的统计值;统计结果包括统计值,但是P值仅写出“0.05”,未列出具体的P值;仅列出具体的P值,而统计值缺失,上述几种情况均不利于文献阅读者进行数据验证和meta分析。例如,本刊《同步放化疗治疗局部晚期食管癌临床观察》一文中,所有统计结果均仅列出了“P0.05”,未列出具体的统计值和P值。

2 针对医学期刊中常见统计学错误的解决对策

目前,医学期刊论文的统计学问题已经成为衡量论文质量高低的重要标准,统计学的错误可能会导致论文学术水平和学术质量的降低,甚至有可能导致严重的后果。近年来,随着广大医学科研工作者和医学期刊编辑及审稿专家对医学统计学应用的重视,医学期刊论文中的统计学问题已经明显减少,但仍然处于较高的水平,这可能与以下几点有关[20-22]:论文作者、编辑及审稿专家思想上不够重视论文统计学应用;期刊编辑的统计学应用知识匮乏;选择审稿专家只注重其专业领域内的影响力,而未关注其统计学应用水平。因此,要想提高医学期刊的统计学应用水平,从而更进一步提高期刊总体质量,需要做到以下几点:作为医学期刊编辑,必须不断进行统计学相关知识的学习,例如参加相关培训班、旁听医学院校的统计学课程及请教统计方面的专家等,以提高自身的统计学应用水平,并从思想上重视统计学应用的审查,在给新投稿件的作者的初步意见中就强调统计学应用的重要性,规定一旦统计学有问题,论文可随时退稿;聘请医学统计学专家进入期刊编委会,负责所有论文的统计学审稿;应通过各种途径,向广大科研工作者宣讲统计学在医学科研工作中的重要性,使其养成良好的正确应用统计学的习惯;在科研课题设计过程中要求有统计学相关专家的参与;科技期刊中增加统计学应用栏目,刊登与本刊论文关系密切的统计学方法,或者刊登一些常见的统计学错误,与作者或读者交流,提高其统计学应用能力。

注 释

[1]孙振球.医学统计学(第3版)[M].北京:人民卫生出版社,2010:1-8

[2]胡良平,郭秀花,刘惠刚.医学统计学是评价医学科技论文质量优劣的重要依据[J].中华口腔医学杂志,2011,36(3):229-232

[3][8]胡良平,李子建.医学统计学基础与典型错误辨析[M].北京:军事医学科学出版社,2003:4

[4] Garc韆-Berthou E,Alcaraz C.Incongruence between test statistics and P values in medical papers[J].BMC Med Res Methodol,2004,4:13

[5]王倩,张博恒.五种中华医学会系列杂志论著中统计方法的应用现状[J].中华医学杂志,1998,78(3):230-233

[6]沈进,苟莉,汤洁,等.生物医学期刊中统计学方法应用情况分析[J].中国修复重建外科杂志,2007,21(5):541-543

[7] [15]王晓瑜,王雅琢.《山东医药》论文中统计学错误分析[J].中国科技信息,2010(16):193-194

[8][9][10][20]邱春晖,郭明兴,邱源.医学论文中统计学方法的误用及其防范措施[J].山东教育学院学报,2009(5):116-118

[11] 冉明会,罗萍,邓丹.医学期刊编辑应注意的几个统计学处理问题[J].编辑学报,2009,21(6):503-505

[12][16][18]李霞,张印朋,闫苏平.医学期刊作者来稿统计学应用与表述常见问题分析[J].中国科技期刊研究,2011,22(1):88-89

[13] 王晓瑜,王雅琢,封艳辉,等.医学期刊投稿常见统计学问题分析[J].科技与出版,2011(11):42-44

[14] 金永勤,王维.医学期刊编辑应重视统计学中的几个问题[J].编辑学报,2009,21(1):33-34

[17]张功员,田庆丰.医学科研论文中统计结果表达和解释错误分析[J].郑州大学学报(医学版),2002,37(3):338-340

[19]叶亮,李伟东,范欣生.医学论文中常见的统计学应用问题辨析[J].南京中医药大学学报(社会科学版),2011,12(4):247-248

[21]吴红艳,尹平.医学期刊编辑应在数据的统计把关中有所作为[J].编辑学报,2008,20(5):400-401

[22]彭敏宁,昌兰.统计学审稿:医学期刊质量控制的重中之重[J].长沙铁道学院学报(社会科学版),2007,8(1):284-285

医学统计学论文范文第6篇

医学统计学是运用概率论和数理统计的原理、方法,结合医学实际,研究数字资料的搜集、整理、分析和推断的一门学科。医学统计在医学杂志中占有重要的作用,而考查稿件质量则主要从专业水平和统计学分析两个方面进行评价。具有创新性、实用性和先进性是高质量论文的前提,而经准确统计学分析得出经得起时间考验的结论才是保证。

医学论文一般是三段式:第一部分为资料与方法,第二部分为结果,第三部分则是讨论。一篇论文涉及到统计方法学方面的可有以下几个部分:一、科研设计阶段:除专业设计外,还需要统计学设计(即实验设计)。二、数据的搜集、整理阶段,此部分需要作者具有较强的统计学思维。三、数据的分析、推断阶段:需要根据统计资料准确选用统计学方法,根据统计结果挖掘有用信息。另外,在查阅参考文献,阅读国内外最新研究动态时,文章中也会涉及大量数据资料和统计学方法。因此,笔者将编辑对三段式论文审稿时需要注意的统计方法学知识总结如下。

一、资料与方法

1.1统计方法 统计方法一般是论文中最容易出错的地方,统计学方法选择正确与否直接影响论文结论的可信度。因此,研究者在编写论文时应根据统计资料类型和研究目的选择合适的统计方法。资料类型一般分为定性资料(计数或品质资料)、定量资料(计量资料)和等级资料(有序或半计量资料)。定性资料的统计方法一般用x2检验,定量资料用t检验,F检验和非参数检验,等级资料则用非参数检验和其它方法。根据分析的需要,统计资料类型是可以相互转化的,如:血红蛋白量原属计量资料,可转化为计数资料或等级资料。值得注意的是,很多研究者在选择统计方法时,只注重统计资料类型,却忽略了研究目的,因而导致分析结果无法解释研究目的。因此,编辑在审稿时除了要注意统计方法是否准确,还应该注意得出的结论与研究目的是否相符。

1.2统计软件 统计分析软件类型及版本应清楚介绍,常用的统计软件有SAS、SPSS和S-plus等。编辑在审稿中须注意不同版本的统计软件拥有不同的功能,编辑须清楚知道研究者论文中所用的软件版本是否能提供该统计方法。

1.3 统计数据的表达方式 数据的表达方式应根据数据的类型及是否符合正态分布的特点。计量资料是连续性分布的数据,此数据分布应通过集中趋势和离散程度相结合来进行描述。描述数据集中趋势的统计学指标有均数、中位数和众数;描述数据离散程度的统计学指标有标准差、极差和四分位数间距。对于正态分布的资料适宜采用“x ± s”来表示,对于非正态分布的资料宜用中位数和四分位数间距来描述数据。分类资料是对受试者或观察对象的每个类别的计数,通常用百分数或其他比值表示,常用的指标有率和构成比等。值得注意的是,研究者在描述数据时,通常只注重数据类型,而忽略数据是否符合正态分布,导致所有的计量资料都用x ± s来表示。为更准确地反映此数据年龄分布的集中位置,宜采用中位数而不是平均数。如:8例疾病患儿年龄(岁)为1、1.5、1.5、4、3、5、5、11,此组数据的平均数为4,中位数为2.75。

1.4 检验水准 绝大部分医学论文都没有标出检验水准,只在结果部分标出P0.05。检验水准一般设定为a=0.01或a=0.05。

二、结果

论文结果部分,一般用三线表格形式表示统计结果,并用文字对表格进行描述,或只用文字的形式对统计结果进行描述。结果描述不应面面俱到,而是根据研究目的侧重描述。不论论文中选用的是何种统计学方法,建议都给出具体的P值,再根据检验水准来确定结论有无差异,结论一般描述为“差异有无统计学意义”。研究者习惯将“P0.05”描述为“差异无统计学意义”,表明在目前的实验设计情况下,由于抽样误差的原因,如果在增加样本数量,差异可能变成“有统计学意义”。结果解释和表达方面,应清楚说明所用统计学方法的具体名称(如:配对资料的t检验,两因素析因设计资料的方差分析等)、统计量的具体值(如:t=3.04,x2=4.68)。

三、讨论

讨论也是论文的重要组成部分,讨论部分写作的好坏往往决定一篇文章的深度,也是其学术水平的标志。编辑在审阅讨论部分时,应注意以研究结果为依据,根据统计推断结果下结论,说明研究的价值和局限性。如果有把握,研究者可以提出新的假设和进一步研究的建议。值得注意的是,研究者根据统计结果得出专业的结论应遵循一个重要原则,即统计结论都是概率性的,因此不能绝对地肯定或否定。

四、书写格式及规范

作为医学杂志编辑,审稿时,除了注意统计内容的准确性,还应该注意统计的书写格式及规范。统计有统一的书写格式及规范,统计学符号有英文、希腊文、大小写、正斜体之分。按GB/T 3358.1―2009/ISO 3534―1:2006《统计学词汇及符号》规定,常用的医学统计符号应按下述要求表示:① 样本的算术平均值表示为英文小写“x”(中位数用M);② 样本标准差表示为英文小写“s”;③ t检验表示为英文小写“t”;④卡方检验表示为希文小写“x2”;⑤ F检验表示为英文大写“F”;⑥ q检验表示为英文小写“q”;⑦概率表示为英文大写“P”;⑧相关系数表示为英文小写“r”。以上符号均用斜体。

总之,每一类统计分析方法均有其适用的范围和应用的条件,编辑审稿时应注意,研究者的论文设计及资料的类型是否选择恰当的统计分析方法,是否存在盲目套用的情况。同时,还应注意得出的结果和结论是否满足方法设计的要求。

参考文献:

[1]胡良平..科研课题的研究设计与统计分析――错误案例辨析与释疑(第一 集)[M].北京:军事医学科学出版社,2008:1.

[2]李慧卿.,陈辉熊,张万霖,等. 早产孕妇血小板参数、纤维蛋白原及D-二聚体水平的变化[J].国际检验医学杂志,2014,35(6):667-668.

[3]冉明会., 罗 萍,邓 丹.医学期刊编辑应注意的几个统计学处理问题[J]. 编辑学报,2009,21(6):503-504.

[4]胡良平,,王功鹏.合理选用统计分析方法[J].中国医学影像学杂志,1996,4(3):185-192.

[5]陆守曾.对医学统计学应用现状的四点看法[J].中国卫生统计,2010, 27(2):114-115.

[6]张晓琳,,王立芹,,康艳荣,等. 临床科研数据统计学处理方法的正确选择[J].实用疼痛学杂志,2009,5(3):165-166.

医学统计学论文范文第7篇

[关键词]医学期刊;队列研究;统计学问题;对策

[中图分类号] R181.2+3 [文献标识码] A [文章编号] 1674-4721(2016)08(b)-0152-03

队列研究又称前瞻性研究、随访研究及纵向研究,是将一个范围明确的人群按是否暴露于某可疑因素及暴露程度分为不同的亚组,追踪其各自的结局,比较亚组之间结局的差异,从而判定暴露因子与结局之间有无因果关联以及关联大小的一种观察性研究方法[1]。这里暴露是指研究对象接触过某种待研究的物质(如重金属等)、具备某种待研究的特征(如年龄、性别及遗传因素等)或行为(如吸烟等)[2]。观察的结局主要是与暴露因子可能有关的结局。队列研究中先因后果的时间顺序相对明确,受一些偏倚的影响小,是观察性研究方法中验证病因能力最强的研究方法[3],其证据等级仅次于严格设计的随机对照试验。尽管我国的前瞻性队列研究起步较晚,但自20世纪八九十年代起也陆续开展了一些队列研究[4]。如果这些研究未能正确使用该研究方法,不但不能有效验证病因假设,还有可能得出错误的结论。本文收集并分析了近年国内公开发表的队列研究论文,发现其中存在的统计学问题并提出改进意见和建议,旨在引起作者、编者和审稿专家的重视,提高期刊论文的质量。

1队列研究文献的检索

以“队列研究”“前瞻性研究”“随访研究”“纵向研究”为关键词,在中国知网(CNKI)和万方数据库中检索2014~2015年公开发表的队列研究文献共1874篇,剔除重复文献和非研究性文献后,获得研究性文献929篇(表1)。

2 载文量及统计学方法应用情况

根据李康等[5]主编的《医学统计学》和Cochrane推荐的Newcastle-Ottawa-Scale(NOS)工具[6]对检索到的文献进行统计学方法应用情况评判,评判结果在文献评价表中登记并复核,采用Excel管理和分析数据。结果发现,绝大多数队列研究采用χ2检验和Logistic回归方法进行统计推断,约占82.0%;而使用了生存分析及Cox比例风险回归模型的仅占13.0%(表2)。

3常见统计学问题

3.1研究对象描述不清楚或不确切

研究对象的选择是随访研究的首要问题,因此文中关于研究对象的描述必须准确清楚,根据研究属于总体研究或是抽样研究,对研究对象的描述应加以区别[7]。目前我国队列研究中关于研究对象的描述主要存在的问题为:描述中对总体研究或抽样研究未加以明确说明;抽样研究中的描写模棱两可,未说明具体抽样方法。从统计学上讲,总体研究的研究对象是根据研究目的所确定的同质观察单位的全体,而抽样研究的研究对象是总体中随机抽取的部分观察单位。

例如,就“某高校教师肥胖率及其对糖尿病发病影响的研究”而言,首先要制定相应的纳入标准与排除标准,研究的纳入标准为“某高校在编、在职且未患糖尿病的教师”,排除标准为“妊娠期、哺乳期女教工”。如果研究为总体研究,其研究对象应是该高校的所有在编、在职且未患糖尿病的非孕(哺乳)教师;如果研究为抽样研究,则其研究对象是该高校所有在编、在职且未患糖尿病的非孕(哺乳)教师的一个随机样本,研究对象描述中还应具体说明所使用的抽样方法,如单纯随机抽样、系统抽样、整群抽样或分层抽样等,同时写明随机抽样的具体实施方法。

3.2结局事件及其判断标准描述不全面

随访研究的另一个重要因素是结局事件,其指随访观察中将出现的预期结果事件,研究中既要记录是否发生了结局事件,还应记录是否存在失访及失访原因(失去联系、因其他疾病死亡、研究终止)。分析我国2014~2015年已发表的队列研究文章发现,大多数研究均未描述是否存在失访,部分研究对结局事件的判断标准描述不全面。按照队列研究的设计要求,结局事件要有明确统一的判断标准。例如,2型糖尿病结局的判断标准[8-9]:确诊糖尿病,即自我报告医生诊断糖尿病和(或)正在使用胰岛素和(或)口服降糖药治疗者;未确诊糖尿病,即未诊断糖尿病但空腹血浆葡萄糖水平≥7.0 mmol/L者;对于随访期发生死亡者,如果其死亡原因中含有糖尿病也认为是随访期发生2型糖尿病。

3.3统计分析不充分或错误

3.3.1基线特征描述不全面 队列研究中暴露组与非暴露组基线特征是否存在差异以及差异的方向直接影响研究结果的解释,因此基线特征的描述是队列研究资料分析必不可少的内容。而目前国内的队列研究文献中存在较严重的不按暴露有无分组描述基线特征的现象。此外,如随访过程中存在失访,则失访者与随访者基线特征的比较也直接影响研究结果的解释。在查阅的929篇研究性队列研究文献中无失访情况描述,无失访者与随访者基线特征比较者达90%以上。

因此,队列研究的资料分析应首先比较暴露组与非暴露组基线特征的一致性,以分析基线特征的差异对研究结果是否有影响以及影响方向,同时也可确定多因素分析中需要调整的混杂因素。如果研究中有失访,还应比较失访者与随访者的基线特征是否一致,以判断失访对研究结果是否有影响以及影响方向。

3.3.2统计推断方法选择不当 统计学方法的选择一向是医学科学研究中的难点问题。队列研究中主要涉及的统计推断方法包括χ2检验、Logistic回归以及Cox比例风险回归模型,此三种方法的误用和混用在队列研究文献中较严重,包括误用χ2检验代替Logistic回归、误用Logistic回归代替Cox回归等。由表2可知,929篇研究性队列研究文献中应用了Cox回归的仅占13.0%,且2015年的比例与2014年基本相同(13.1% vs 13.0%),可见这一方法的正确应用近两年内并未引起作者以及编辑足够的重视。

队列研究中统计学方法选择的正确思路为[10]:若暴露组与非暴露组的基线特征一致,则可以直接应用χ2检验比较暴露组与非暴露组结局事件发生率的差异,以判断暴露因素与结局事件是否有关联,同时计算相对危险度(relative risk,RR)及其95%置信区间,进一步说明两者的关联强度。相反,若暴露组与非暴露组的基线特征存在差异,应采用多因素的回归分析对混杂因素进行控制。如果数据资料中无时间变量,可采用Logistic回归,并在模型中调整组间存在差异的基线特征变量;如果有时间变量,则应采用Cox回归,并在模型中调整组间存在差异的基线特征。

3.4其他问题

国内公开发表的队列研究文献存在的其他问题:①应用Logistic回归或Cox回归时,分类变量或等级变量无赋值说明,造成结果解释的混乱。例如,只有在明确“男性=1,女性=0”或者相反的情况下,才能正确解释暴露因素与研究结局之间的关系。②误用χ2检验公式:应该使用校正公式时,却应用了非校正的通用公式或专用公式;不能应用χ2检验时,却计算了χ2值。例如,两组率比较时,只有满足总例数n≥40且理论频数T≥5的条件下,才能采用非校正的四格表χ2检验的通用公式或专用公式;如果n≥40且1≤T

4队列研究医学论文作者及编辑应注意的问题

分析结果表明,队列研究医学论文的统计学方法应用基本正确,编辑人员也比较重视统计学方法的使用情况,但是仍有部分论文在研究设计和统计分析方法的应用上存在一些问题,导致的研究结果缺乏科学性和可信性。为使作者、编辑和审稿者高度重视统计学的正确应用,进一步提高队列研究医学论文的质量,笔者认为还应做好以下工作。

4.1提高对统计学知识的认识,强化统计学意识

目前,国内医学科研工作者未认识到医学统计学的重要性,对医学统计学的重视程度还不够。因此,要加大“医学统计学在医学科研中重要性”的宣传力度,提高科研工作者对医学统计学的认识;在医学科研工作中普及医学统计学知识,强化医学统计学意识,促使其在科研设计、数据分析和论文撰写中正确应用医学统计学方法[11]。

4.2加强流行病学与医学统计学专家审稿工作

医学研究,包括队列研究,其统计分析都是以科学研究设计为基础的。研究设计不科学、有缺陷,即使应用了高级的统计学方法也于事无补。所以,审稿专家在具备丰富的专业知识的同时,还应具备一定的医学统计学和流行病学知识,能够做到从研究设计到统计分析,系统地审核研究结果的科学性、可靠性,确保论文质量[12]。此外,如果条件允许,所有稿件应先通过流行病学与医学统计学专家的审核,然后再由各专业学科专家审稿,以确保研究成果的真实可靠[13]。因此,医学期刊编委会应增设流行病学与医学统计学专业的专家委员,严格审核论文的研究设计和统计分析,不合格的论文坚决不发表,这样才能不断提高稿件质量和水平。

有计划地定期聘请流行病学与医学统计学专家对期刊编辑人员进行流行病学与医学统计学知识培训[14]。通过定期举办专业知识讲座、选派编辑人员参加专题培训班、定期组织考核、根据考核结果给予适当奖励等措施,以提高编辑人员学习流行病学与医学统计学知识的积极性,不断提高其相关知识水平,最终达到提高论文质量的目的。

[参考文献]

[1]张啸飞.前瞻性队列研究及生存分析[A]//2014浙江省临床流行病学与循证医学学术年会论文汇编[C].浙江,2014: 15.

[2]李立明.流行病学[M].5版.北京:人民卫生出版社,2003:58-59.

[3]李立明,吕筠.大型前瞻性人群队列研究进展[J].中华流行病学杂志,2015,36(11):1187-1189.

[4]王慧,陈培战,张作文,等.我国人群队列研究的现状、机遇与挑战[J].中华预防医学杂志,2014,48(11):1016-1021.

[5]李康,贺佳.医学统计学[M].6版.北京:人民卫生出版社,2013:84-150.

[6]何琼,黄渊秀,康文婧,等.2001-2010年我国伤害预防病例对照研究及队列研究文献质量评价[J].中华疾病控制杂志,2014,18(10):913-916.

[7]王芳,戴国华,娄昊.循证中医药队列研究的随访设计[J].山东中医杂志,2016,(1):14-17.

[8]樊森,陈纪春,黄建凤,等.中国成人看电视时间与2型糖尿病发病关系的前瞻性队列研究[J].中国循环杂志,2014, 29(5):372-376.

[9]李卫东,傅坤发,连燕舒,等.成人非酒精性脂肪肝与2型糖尿病发病关系的前瞻性队列研究[J].中国全科医学,2015, 18(28):3426-3429.

[10]韩梅,陈薇,曹卉娟,等.比较效果研究常用方法之二:队列研究设计[J].现代中医临床,2015,22(3):20-23.

[11]沈洪兵.重视大型队列研究的人才梯队建设和技术储备[J].中华预防医学杂志,2014,48(7):547-548.

[12]高永,张中文,石德文,等.基于Excel的统计分析系统在期刊编辑部审稿中的应用[J].编辑学报,2013,25(5):478.

[13]黄晨,袁平戈,张大志.医学期刊来稿中有关统计学错误分析[J].现代医药卫生,2013,29(15):2268.

[14]韩磊.医学期刊编辑提升统计学素养的难点及策略[J].科技与出版,2016,(1):50-53.

医学统计学论文范文第8篇

统计设计是整个研究中最重要的一环,是研究工作应遵循的依据。常见的统计设计问题有:忽视组间均衡性,样本缺乏代表性,样本例数不足,未设置对照组,未随机分组,未提出统计分析方法等。针对以上问题,在科研设计中一定要遵循实验设计的四大原则即“随机、对照、均衡、重复”的原则[6]。

1.1不遵循或不重视随机化原则

随机化是科研设计的重要原则,直接影响研究结果的可信度。随机化既要随机抽样,还要随机分组,并有足够的样本量作前提。然而,在医学论文中许多作者对此不够重视,主要表现在论文中统计处理随机化不突出,随机化缺失情况比较常见,有的论文甚至将随机误解为随意、随便,不采用随机化处理方法,导致结果缺乏可靠性。还有些文章中没有提出“随机”抽样的设计与方法,没有排除标准,给人随意选择病例之感,且病例数少,因此没有代表性,所得出的结论不可靠。部分文章虽然注明了“随机”,但未提及采取什么方法进行随机化研究或两组间的例数相差甚远,不符合随机化的一般规律,没有临床参考价值[7]。

1.2缺少对照研究或对照组设计不合理

正确设立对照是临床或实验研究的一个核心问题,设立对照的意义在于说明临床试验或实验研究中干预措施的效应,减少或防止偏倚和机遇产生的误差对试验结果的影响。目前,国内许多期刊发表的论文对照组设计不合理现象比较普遍,尤其有些作者对某种新药或新技术在临床的应用观察研究中,不设对照组,缺乏对照观察,得出的结论缺乏科学性,令人怀疑。有的文章虽然设立了对照组,但在分析结果时,却没有将试验组与对照组的结果进行比较,而仅将各组间的自身前后进行比较,从而使该研究失去对照意义。对照组选择不当,还表现在两组间重要的临床特征和基线情况相差太大,无可比性,如性别、年龄、病情、经济情况和文化程度等不一致,如有些论文将健康人或志愿者作为对照组,使结果受到非处理因素的影响,产生偏倚或系统误差,使结论不可信[7]。

1.3均衡性原则掌握不够

均衡性原则要求实验中的各组之间除处理因素不同外,其他可控制的非处理因素要尽可能保持一致。特别对疾病预后有重要影响的临床特性一定要在组间分布均衡。各组间越均衡,可比性越强。有些作者在对病例进行分组时,忽视了均衡性原则,两组之间没有可比性,结论自然是错误的。具体表现在:有的文章对治疗组与对照组的相应统一指标没有设在均衡的水平上。对治疗组情况交代的比较详细,而对对照组的年龄、性别、病情等不予交代,或所选对照组的年龄与治疗组不在一个年龄段,影响了作者对指标的观察[7]。

1.4重复的原则掌握不好

所谓重复,一是指重复试验或平行试验,二是指各样本组的例数要有一定的数量,即样本的例数要足够大。虽然随机化是增强非处理因素均衡性的重要方法,但当各组内例数过少时,尽管采用了随机化分组的方法,也难以保证非处理因素的均衡一致。在随机化分组的基础上,只有样本例数足够大,才能使非处理因素均衡一致,同时也才能使抽样误差减小,增强样本对总体的代表性。一般来说,在随机分组的前提下,样本例数越大,各组之间非处理因素的均衡性越好;但当样本量太大时,往往又会给整个实验和质量控制工作带来更多的困难,同时也会造成浪费。为此,在实验设计时,还应保证在实验结果具有一定可靠性的前提下,确定最少的样本例数。一般说来,计数指标每组样本不得少于20~30例,计量指标每组样本不得少于5~10例。在多因素分析时,一般认为样本例数至少为观察指标的5~10倍[8]。

1.5样本的含量

样本的含量的大小直接影响到结论的可靠性。样本量过少,则抽样误差大,结果可靠性差,且经不起重复验证;反之,盲目加大样本量也会造成人、财、物的浪费,同时也造成非抽样误差增大。故应在保证研究结果精确可靠的前提下,确定最小的样本量。如某篇论文报道某药治疗的临床疗效,实际总例数为10例,其中6例有效,于是作者得出有效率为60%。显然,有限的病例数不能充分说明该药是否有效,作者贸然得出结论,容易给他人造成假象甚至误导[9]。

2统计方法选择与使用不当

在选择统计方法之前,首先应确定研究资料是计数资料还是计量资料。只划分其类别而得到的资料为计数资料,也叫定性资料,如根据治疗结果计算出的治愈率、阴性率、阳性率等。测定某个具体数值而得到的资料为计量资料,如血压值、血细胞计数、血氧分压测定等许多物理诊断和化验检查的结果。目前,医学论文中计数资料最常用的统计方法为χ2检验,计量资料最常用的统计方法为t检验。值得注意的是,各种假设检验方法均有其适用条件,应根据资料特点来选用最适当的方法。均数与标准差分别是描述正态分布资料集中和离散趋势的指标。能否选用“均数±标准差”来描述某一资料的分布特征,关键看该资料是否符合正态分布。当资料不符合正态分布或方差不齐时,应将资料转换使之符合正态分布,方差齐性后再用t检验或方差分析,否则用秩和检验。有些作者在使用t检验时,未考虑到上述适用条件而盲目使用,造成统计学处理不当或统计学计算错误[10]。

2.1统计指标应用不当

2.1.1描述计量资料的统计指标描

述计量资料的统计指标主要有平均数指标(算术均数、中位数M等)和变异指标(标准差s和四分位数间距Q等),在应用时一定要注意它们各自的适用范围。对于非对称分布资料,算术均数不能反映数据的平均水平,应采用中位数描述。一般地,正态资料或对称资料用描述,偏态资料用M和Q来描述。在不能确定数据的分布类型时,应选用M和Q进行统计描述。四分位数间距Q是75%分位数P75和25%分位数P25之差,即Q=P75-P25,所谓百分位数Px是将全部观察值分为两部分,理论上x%的观察值比它小,(100-x)%的观察值比它大,中位数M是50%分位数P50。、s、M、Px与Q可通过统计软件直接输出[9]。

2.1.2描述计数资料的统计指标描

述计数资料的统计指标有绝对数和相对数。绝对数是原始资料经汇总得到的小计或总计数。相对数是两个有关的绝对数之比,主要包括率和构成比(百分比)。医学论文中相对数应用的主要问题之一是分母较小。分母较小时,相对数的可靠性不能保证,在这种情况下,宜直接用绝对数进行描述而不宜计算相对数。医学论文中相对数应用的主要问题之二是将构成比误用来说明事物发生的强度。构成比只能反映事物的内部构成,不能说明事物的发生强度。医学的研究对象主要是人以及与人体有关的各种因素。由于生物现象的变异较大,各种影响因素又错综复杂,研究常是抽样观察,使事物本质差异与抽样误差混杂,故需用统计方法透过偶然现象来探测其规律性。如果不能正确运用统计学方法,造成统计学上的偏差或失误,就很容易把本来成功的结果当成失败而放弃,或把失败的教训误认为成功的结论而加以宣传。在进行科研设计时要严格遵循科学的统计学分析方法,不能留下隐患,否则,再高明的统计学专家和统计学软件也无法弥补科研设计缺陷造成的损失。总之,统计学分析在医学研究和论文写作中意义重大。作者在撰写论文时,应注意识别、总结有代表性的、有借鉴意义的统计学领域的缺陷、失误或错误的多发点,特别留心易出现统计错误的险区,从而使论文中的统计学问题减到最低限度。认真检查、仔细核验,尽量避免上述错误,必要时还可以请统计学专家帮助把关[12]。

2.2统计方法描述或选择不当

统计方法选择非常重要,它直接影响结论的可靠性[12]。临床资料的结果变量可分为计数资料、计量资料和等级资料。计数资料指将观察对象按两种属性分类,如生存、死亡,治愈、未治愈,有效、无效等,通常转化为率。如果是两组间的比较,则采用四格表χ2检验或其校正公式,如果是多组间率的比较,则采用行×列表资料χ2检验。计量资料指对某一个研究对象用定量的方法测定某项指标得到的资料,一般均有计量单位。通常资料呈正态分布时,两组间均数比较用t检验,多组间均数比较用方差分析和q检验。当资料不呈正态分布或方差不齐时,也可用秩和检验等非参数检验法。

2.2.1统计方法描述不清

医学论文中常可发现作者未交代所用的统计方法,如是配对设计的t检验还是成组设计的t检验,是Ridit分析还是χ2检验,是作相关分析还是作回归推断。统计方法交代不清或根本不予交代,使读者对论文结论的正确与否无法判断。有的作者只提一句“经统计学处理”后,就写出结论。有的甚至直接用P值说明问题,笼统地以P<0.05或0.01、P>0.05便称结果差异有无显著性,P值的大小不说明差值的大小,它还与抽样误差大小有关[13]。因此,还应写明具体的统计方法,如有特殊情况,还应说明是否采用了校正,应写出描述性统计量的可信区间,注明精确的统计量值和P值,然后根据P值大小作出统计学推断,并作出相应的医学专业结论。

2.2.2假设检验方法交代不清不交

代假设检验方法或假设检验方法交代的不具体、不清楚是医学科研论文中常见的错误。如果不交代假设检验方法或假设检验方法交代的不具体,读者就无法考察论文的统计学方法选择的是否正确,无法核对计算结果是否准确。每一种假设检验方法都有其特定的适应条件和严格的适用范围。对于同一组资料,采用不同的假设检验方法可能得出截然相反的结论。如将配对设计的资料按成组设计资料的方法处理,将会损失样本提供的信息、降低检验效率,可能使原本有统计学意义的结果无统计学意义[14]。在论文写作时,不但要交代选用的是什么统计学方法,而且统计学方法要尽可能具体。如选择t检验,要说明是配对t检验,还是成组t检验;选择方差分析时,要说明是完全随机设计的方差分析,还是配伍组设计的方差分析。对于四格表资料,应说明是一般四格表χ2检验、配对四格表χ2检验及四格表资料的精确概率法等。

2.2.3统计方法选择常见错误

①误用χ2检验。χ2检验有一定的适用条件,n>40且理论数(T)>5时,可用一般χ2检验;n>40,但至少有1个T>1且T<5时,可用校正χ2检验;n<40或T<1时用χ2检验的确切概率法[15]。②t检验误用于多组资料的比较。在医学期刊中常会出现将t检验误用于多组资料的比较。多组资料的比较应该采用方差分析(F检验),当差异具有统计学意义时,再进一步作两两比较。当各组均与一个对照组比较时采用Dunnettt检验;当各组相互循环比较时,则常采用Student-Newman-keuls(SNK)检验,又称q检验[16]。③配对t检验与成组t检验误用。大部分论文只注明采用t检验,而未注明是配对t检验还是成组t检验。配对t检验常用于处理前后的自身对照,即差值均数与总体均数“0”的比较;成组t检验适用于成正态分布的两个小样本均数间的比较。④资料不呈正态分布时未用非参数检验。t检验F检验等适用于呈正态分布、方差齐且有确切的测量数值的资料,而非参数检验(如符号检验、秩和检验Wilcoxon法、秩检验-KruskalWallis法、Friedman法、Ridit分析、Seperman相关等)对资料无特殊要求,对按大小顺序、评分、等级、反应程度甚至色调深浅等资料都可进行分析比较[17-18]。因此,对于多组计量资料的比较,呈正态分布且方差齐时用F检验,方差不齐时可用变量变换,或采用秩和检验;对于两个小样本均数的比较或处理前后的比较,方差齐时用成组t检验或配对t检验,方差不齐时用t′检验[19]。

3结果解释时存在的问题

统计分析的结果是无效假设或是不能无效假设。无效假设在一般的统计检验为两组总体参数相等。无效假设只能说两组总体参数不相等而并不能说两组相差很大。两组相差如何要对可信区间进行研究观察后得出。由于统计检验不能得出差别的大小,因而结论不能说“有明显差异”或“有显著差异”,也不能说“差异非常显著”,更不能说“差异明显”。在国外的统计书籍上的英语表达为“significant”,它的正确意义应当是“有意义的、有重要性的”。俄语为“Значмый”和日语中的“有意”也是这个意思。国内只有极个别的英汉词典把“significant”误译为“显著的”。正确的说法应当是“差异有统计学意义”或“差异有高度统计学意义”等[20]。在解释差别有统计学意义的结果时,有些人常常根据P值的大小作出对实验效应差别程度不同的专业结论[21]。例如某实验研究,比较甲、乙两种治疗方法对某病的治疗效果(假定甲法的疗效优于乙法),若得到“P<0.001”,则认为甲法极显著优于乙法;若得到“P<0.01”,则认为甲法非常显著优于乙法;若得到“P<0.05”,则认为甲法显著优于乙法。犯这种错误的原因是错误的理解了统计学中P值的概念[7]。统计学上根据假设检验原理推算出来的P值表示拒绝特定的无效假设可能犯假阳性错误的概率。P值的大小并非指差异的太小,只能反映两者相同或不相同。P值越小,说明越有理由认为两种处理方法效果不同,而不能反映对比的两组或多组之间差异的大小。差异的大小只能根据专业知识来确定。此外,甚至在部分投稿文章中未交代所采用的统计分析方法,也未见应用统计学的迹象,仅从各组数据的均数大小做出了统计推断。医学期刊论文中暴露出来的统计学错误,从表面上看是编辑部和审稿者把关不严所致。事实上,即使审稿时发现了上述错误,也无法改正。因为实验设计的错误只有在科研工作开始之前才有可能得到纠正。即使编辑工作者能够阻止有严重统计学问题的,也仅仅是治标而已。如何使广大医学论文作者在医学研究中正确应用统计学,提高科研质量才是治本[7]。

4对策与建议

众所周知,统计学是从事科学研究不可缺少的工具。从试验设计、资料收集与表达、数据处理和结果分析,每一个环节都需要正确地运用统计知识,才能真正发挥统计学在科学研究中应起的作用。然而,在已出版和发表的一些学术专著和论文中、通过评审的科研成果和答辩的学位论文中,经常可以看到忽视、轻视和误用统计学的现象[22]。

应完善编辑人员的知识结构,保证统计学应用的准确性。为此,可定期聘请统计学专家对审稿人员进行统计学知识培训。科技期刊的群体效应理论[23]认为,期刊编辑的专业结构应多元化,以利于编辑互相学习,实现知识互补。医学期刊编辑部可考虑聘用统计学专业的研究生作为编辑。编辑应将医学统计学作为自己的必修课,通过多种方式,如自学自修,参加讲座或培训班学习统计学知识,有条件的编辑部,如医学院校学报编辑部,可以有计划地组织编辑参加本科生或研究生医学统计学课程的学习,也可鼓励编辑人员在职攻读统计学专业研究生学位。这样,可以提高全体编辑人员的统计学水平,最终使编辑和审稿人都能够发现论文中存在的统计学错误,并指导作者修改,正确进行医学论文中有关统计学分析的描述[24]。另外,有关职能部门或学会可组织与医学统计学相关的培训班,聘请统计学专家讲课,对编辑人员进行定期统计学知识培训,加强科研设计、统计学知识的学习[19]。

4.2加强医学统计学专家审稿

医学研究论文专业性强,经常涉及统计学处理问题,有时会遇到统计方法复杂的稿件,这不仅需要本学科专家审稿,而且需要医学统计专家把关,只有这样,才能保证论文所报道的研究成果的真实性和可靠性。医学期刊编委会中应有统计学专家,专门负责稿件统计学方面的审查工作。

4.3强化作者的统计学意识

目前,我国医学科研工作者对统计学的重视不够,没有认识到统计学的重要性。因此,要加强宣传,提高医学科研人员对统计学重要性的认识,强化他们的统计学意识,务必在科研工作中和撰写论文时做到正确应用统计学。另外,还可以对作者开办有关科研论文撰写知识的培训班,面向临床医生,特别是年轻医生定期培训。请有研究经验的专家讲授科研课题的设计方法、如何正确运用统计学方法等。这些措施有利于强化作者的统计学意识,并树立其精品意识,有利于增加优质稿源,从而提高期刊学术质量[19]。

医学统计学论文范文第9篇

关键词:医学统计;方法;运用;原理;选择

中图分类号:C81 文献标识码:A 文章编号:1001-828X(2014)05-00-01

一、统计学方法简介

统计学方法包括统计软件包、统计分析方法以及检验水准三方面的内容。其中医学论文中常提到检验水准即α,它是用来表示组间实际无差别而统计结果判断有差别,犯这类错误的概率。实际工作中常取α=0.05,当研究数据计算的P值小于0.05时,组间差异比较被认为有统计学意义。统计学方法包括统计描述和假设检验两个方面的内容。统计描述是指根据资料及原始数据分布的类型,选择正确的指标来描叙资料及数据的特征。而假设检验即组间差异性检验,是医学论文中最常用的统计学方法。资料类型则包括能用具体数据表示的定量资料与不能用具体数值表示但能反映被观察对象某一特征的定性资料。定性资料的统计描述包括率、相对比和构成比。而参数法及非参数法是常用的定量资料统计分析方法。参数法一般包括t检验、方差分析,非参数法常用的有秩和检验。

二、试验设计中的统计学原理

合理的试验设计与统计处理的可信度存在直接联系,研究者在编写医学论文时应对医学研究设计方法进行说明。在进行试验设计时应遵循随机、对照、均衡和重复四大原则。在进行试验设计的时候通常会涉及到研究对象的选择,研究对象的分组及选择合理的检测指标三个方面的内容。

医学论文就是通过对样本的研究来进行推断总体,找出其共性,得出结论。因此研究者在选择研究对象时应注意选择样本应具有一定数量,能反映出该事物的规律性特征,但又应注意例数不能太多,以免造成不必要的浪费。其选择的原则就是在保证试验结果可靠性的前提下选择最少的样本例数。研究者在选择样本对象后应对其基本特征进行详细的描述,比如患者的年龄、性别、病理分期、疾病诊断的标准等。此外在试验中所用到的试剂、仪器的型号、规格等都应作出说明,以供读者借鉴和做出判断。选定好研究对象后就要对其进行分组。在进行分组时研究者一般遵循统计学中的“随机分配”、“设立对照”以及“均衡”、“重复”的原则。随机化原则是提高组间均衡性的一个重要手段,也是资料分析时进行统计推断的前提。有对照才有比较,在进行组间比较时,应确定好处理因素与实验效应的关系。均衡性则是要使得对结果产生影响的非处理因素尽可能保持一致,这样才能保证对照的结果让人信服。观察实验效应的指标主要有主观指标与客观指标。正所谓主观指标就是通过问答的方式调查受试者自己判断的主观感受;而客观指标则是通过仪器来检验和测量所得出的结果。在进行试验设计时应选择客观性较强、高灵敏性和精确性的指标。

三、统计学方法的选择

统计学方法的正确选择是直接影响到论文结论可信度的重要依据,因此研究者在编写论文时应注意选择合适的统计学方法。不同的统计学方法应用的范围不同。研究者在编写医学论文时常根据论文研究的目的、资料类型、试验设计的方案、样品大小、水平数、特定条件、数据分布特征以及综合分析等来选择对应的统计方法,同时还要根据专业知识与资料的实际情况,结合统计学原则,灵活地选择。当定性资料正态分布时,研究者一般用均数和标准差来表示统计描述指标;当定性资料不符合正态分布时,则可选用中位数及级差来表示;当定量资料正态分布且组间方差齐时一般选用参数法,反之则选用非参数法。t检验一般适用于小样本(n

四、常见统计学方法的误用分析及对策

1.统计方法误用。最常见统计方法误用是对等级资料进行比较时应用秩和检验而误用卡方检验。例如:在评价采取不同治疗方法的两组急性脑血管病患者疗效中,治疗组显著有效、有效、无效三种分型分别为15例、10例、8例,对照组分别为14例、11例、9例。本资料例数较少,应选用等级比较的秩和检验,而有些作者却认为只要是率的比较就可以采用字检验。研究者在选择统计学方法时应根据相应的原则,对文章研究目的、资料类型、样品大小、水平数、数据分布特征等进行综合分析后,再来选择对应的统计方法。

2.选用检验方法错误。在有些论文中,作者常将本应用方差分析和q检验的误用t检验。t检验一般适用于小样本(n

五、结论表述中的统计学应用

资料的统计处理不是医学研究工作的最终目的,而是通过统计学分析为研究结论提供依据或者线索。因此,在对统计资料进行分析后应把握统计学术语,对结论做出科学的分析跟解释。在根据统计结果得出专业结论时研究者应遵循一个重要原则,就是统计结论都是概率性的,不能绝对地肯定或否定。研究者习惯上将“P

参考文献:

[1]医学统计工作的基本内容[J].国际检验医学杂志,2013(19):2563.

医学统计学论文范文第10篇

前面几讲,我们讨论了一些临床研究的方法。然而临床研究的结果,最终多以论文的形式发表在医学期刊上。虽然风湿病学的论文质量不断提高,但运用循证医学的评判(criticalappraisal)提纲来阅读,仍有较大的距离。

临床医学论文的结构如图1所示,其中摘要部分一般有固定的格式,即“目的、方法、结果、结论”,摘要部分只求简单扼要,不要详细的解析和分析。因此,下面重点讨论后面四大部分。

1.引言

引言俗称为“开场白”,对判断文章的价值有重要的作用。它不但给读者,也往往给审稿人和期刊编辑部一个“先入为主”的印象。临床文献评判提纲的第一条就问到[1]“作者研究的目的是什么?是否为解答某个(些)研究问题或验证某个假说?如果是的话,你能否从文章中归纳出该研究的问题或假说?这个研究问题或假说是否关于某个干预(如治疗)的效果、因果关系或确定某个健康问题的强度?”引言中最重要的内容就是要清楚地将研究的目的告诉读者,同时要交代研究的背景和立题的依据。一般要求先从总体上介绍研究背景,逐渐缩小到立题依据,再集中到研究目的。所以如图1所示,引言部分呈倒梯形结构。

国际上有一些医学期刊,要求在引言部分详细地介绍研究背景和立题依据,但更多的国际和国内医学期刊,是要求在引言部分简明扼要地介绍研究背景和立题依据,然后集中到研究目的。这样一些研究背景和立题依据的内容,就需要在讨论中描述。一个好的引言应该是用几句话概括先前这个领域的研究,接着说明这个研究的必要性,必须如实地阐述你的研究比先前的研究好在哪里,新在哪里。

2.材料与方法

2.1文章科学性和有效性的体现许多基层医院的医生和没有循证医学概念的医生,在阅读论文时,常常不太注意其研究方法。然而这一部分的内容往往体现出文章的科学性和有效性,因此它是期刊确定论文的取舍最关键所在。临床文献评判的9条提纲中,有7条是反映在“材料与方法”部分。

由于国内风湿科医生中接受过流行病知识培训者甚少,加上许多人在平时阅读文献时,常跳过“材料与方法”部分,致使风湿病学的论文普遍存在这样的问题:如果论文涉及到有实验室内容者,则将大部分的篇幅放在描述实验室的方法,而忽略了体现文章的科学性和有效性的内容;如果论文不涉及到有实验室的内容,则不知道这部分该写什么,不少临床论文在“材料与方法”部分中,只用几行字,因为“没东西好写”。其实一篇论文质量高低,往往体现在这一部分。因此,要提高风湿病学论文的质量,需要从这里入手。

建议有志于提高自身论文写作能力的年轻风湿科医生,从Lancet、NewEnglJMed、BMJ、JAMA等高级期刊中,寻找10~20篇自己感兴趣领域的论著,详细阅读(重点放在“材料与方法”部分),并选其中3~5篇,按评判提纲进行评判性的阅读。完成以后,对你的临床研究和论文书写必将会有长足的进步。笔者在国际临床流行病学工作网,澳大利亚的培训中心学习期间,各国学员普遍都感觉到,在上了“criticalappraisal”的课和做完“criticalappraisalExercise”的作业后,有“茅塞顿开”的感觉。

2.2需要阐明的内容不少论文将病例的性别、平均年龄、平均病程、基线的比较等“结果”部分的内容提前写在“材料与方法”中,这是不恰当的。“材料与方法”主要是描述该研究的计划,主要包括6个方面。

2.2.1研究策略:论文需要阐明研究策略[2],可以直接,也可以间接,但必须让读者很明确地知道本研究的策略。因为读者需要判断,该研究策略用于解答本项研究的问题是否恰当。风湿病学的论文中,实验性研究(随机临床试验)和分析性研究(队列研究与病例对照研究)较少,多数论文是描述性,或者根本无法从论文中悟出其研究策略。因此,强调在写文章时,需要留意一下研究策略交代清楚了没有。因为没有研究策略的论文,资料再好,也只能是一盘散沙。

2.2.2研究样本:临床研究的样本主要是病人,样本来源必须被阐明。研究病例最好是某一时段内的连续性的病人,如果不是连续性的病人,有必要阐明如何从大组的病人中选取研究样本。风湿病学的论文中,不少在介绍研究对象时只简单地提到“××病××例,均符合××诊断标准”,至于研究样本来自何方,是哪个年代的病人,如何抽样等等,一概不说。这样的论文,读者根本就无法判断该研究的外部有效性,难以被循证医学接受。研究样本的入选标准和排除标准也必须详细描述。在病例对照研究中,对照组的构成和来源必须交代清楚,因为对照组的确定问题,容易造成偏倚。

2.2.3研究因素:在实验性研究和分析性研究中,研究因素非常重要,往往是该项研究的核心内容。因此一定要明确交代研究因素以及测量这些研究因素的方法。在实验性研究,分组是否真正随机,如果不是随机,必须比较两组间的基线是否基本相同;干预组和非干预组的治疗方法有何区别,除干预之外,其他治疗是否相同,干预组和非干预组各自的治疗方法必须交代清楚。分析性研究中,研究因素存在与否,是病人进入研究时已经存在,而不是按照研究者的意愿进行分组的。因此,需要交代的是其测量方法,而不是分组。在审稿时,见过一些论文错误地将类风湿关节炎的病人“随机地分类风湿因子阳性组和阴性组”。在队列研究,研究因素的确定在先,结局的判断在后,一般较少发生研究因素测量时的主观偏倚;但在病例对照研究,由于先确定病例组和对照组,在回顾暴露因素时容易出现主观偏倚,文章在这里必须交代避免偏倚的方法,如采用盲法等。

2.2.4研究结局:研究结局的判断必须准确无误,因此需要交代判断研究结局的方法。如果结局的判断受研究者主观因素的影响,如关节炎的放射学损害,则必须交代是否采用盲法。在随访研究(包括随机临床试验和队列研究)中,失访病例如何归属,及其随访时间如何确定,均需交代清楚。对于不以死亡为结局的研究,如何处理死亡者的资料,算删失还是终点,时间如何确定等等。

2.2.5控制混杂和偏倚的措施:如果研究因素和研究结局之间有可能存在混杂因素,必须有措施去校正混杂因素所导致的偏倚。对于多因素的因果关系推导,必须采用多元回归的方法校正各因素之间的相互混杂。见过一篇强直性脊柱炎髋关节损害的相关因素的分析,立题和所收集的资料都很好,可惜只简单地采用t检验和χ2检验进行单因素分析,没有校正各因素之间的相互混杂,如果作者在论文书写时,有“混杂”这样一个概念,自己或请统计学的老师,再花几十分钟的时间,进行多因素分析,论文的质量和可循证性将会有大幅度的提高,仅一念之差而使论文质量未能进一步提高,多么可惜。减少或避免偏倚的措施需要交代,如在时间较长的随访研究中,如何减少失访。盲法不单只应用于实验性研究,在分析性研究中,研究因素和研究结局的确定和判断,也常常需要采用盲法。可导致偏倚的种类很多,本刊2000年有一讲座《如何识别和控制临床研究中的混杂与偏倚》已经详细介绍。

2.2.6统计学方法:实验性和分析性的医学论文,均必须明确地交代统计学方法。多年来,风湿病学论文中统计学方法存在的问题较为突出。

有不少论文没有交代统计学方法,多是那些含有实验室研究内容的文章,由于花了大量的篇幅介绍实验室的流程,使“材料与方法”部分显得“充实”,因此遗漏或省略了统计学方法的描述,使文章不完整和欠缺科学性。有些文章在“统计学方法”一栏中,只用了5个字:“采用t检验”。也有些只写“全部数据均由SSPS8.0软件进行统计学处理”。没有交代具体的统计学方法。让人感觉到,这是在应付式的填补“缺项”,写了等于没写。

虽然t检验和χ2检验是基本的统计学方法,但并非“放之四海而皆准”。风湿病论文中,常由于盲目运用t检验和χ2检验,导致质量不高。首先并非所有资料的统计分析均可以用t检验和χ2检验,病例数少和非正态分布的资料就必须用非参数检验方法,如秩和检验和精确概率法等。多组间的比较可能需要采用方差分析;随访资料(如随机临床试验、队列研究等)用生存分析方法可能更佳;存在多因素的因果关系分析(如预后因素分析、病因学研究等)需要多元回归分析等等。不少论文在交代统计学方法时,笼统地说采用多元回归的方法,究竟是哪一种回归方法没有说明,从“结果”中也看不出其资料是否采用了回归方法。滥用相关分析和直线回归的现象也很普遍。实际上,相关分析是一种低层次的统计学分析方法,主要用在描述性研究(如横断面研究)的资料分析,而一般不用于实验性和分析性研究的资料分析。因为相关分析有统计学意义并非代表两组资料存在相关关系。由于在回归分析的统计学教学中,一般是从直线回归到Logistic回归,再到cox回归,因此回归分析的原理和精神,多在直线回归中进行交代,使学习统计学的医学研究生们普遍对直线回归的印象较深。其实直线回归分析很少被运用于医学研究,医学研究中运用的最广的回归分析是Logistic回归和COX回归。

另外,风湿病学论文中,极少提到样本量的推算。样本量的推算主要是使研究的结果避免犯统计学第Ⅱ类错误。第Ⅱ类错误是指由于样本量不足,使得本来有差异的两组,运算出无差异的结果。样本量的推算是根据研究者期望的差异值、检出意义的水平(α值)和研究的功效(1-β值)。β值是允许犯第Ⅱ类错误的概率。一般要求α值=0.05,研究功效在0.8或0.9。当你的研究结果中存在P值>0.05时,则要求文章有样本量的推算,或提供研究功效。

3.结果

写论文最主要的目的就是向读者展示研究的结果,论文的核心和精髓主要体现在“结果”部分。因为在“引言”部分,你所提出的问题,均可在“结果”部分找到答案。这部分要求对研究结果进行客观的陈述,既不受其他文献的影响,也不受作者主观意愿的左右。所以图1所示,“结果”部分是一个方形的结构,提示它不需要拓展,只是要客观的陈述。

一份好的“结果”,必须让读者顺着你的思维,一步一步地获得答案。通过文字告诉读者本研究发现了什么;通过表格将具体的数据有条理地展现给读者;通过图形使读者能够直观地理解研究的结果。

3.1研究资料基线的描述虽然有些作者将研究资料基线的描述放在“材料与方法”中,但实际上基线的描述放在“结果”中更加确切。因为“材料与方法”主要是交代研究的计划,至于所收集的病例中年龄多大、男性占多少、病程多长等等,是在结束研究后资料分析时才知道。如果是分组的研究,需要比较各组间的基线是否相同。随访研究还要比较失访者或中途淘汰病例的基线是否有别于组内待分析病例的资料,让读者知道失访或中途淘汰病例是否导致研究的偏倚。

3.2统计学运算结果实验性和分析性研究的结果很大部分是来自统计学运算的结果。这里结合这几年风湿病学论文的“结果”部分常见的一些错误(不一定在本刊)进行讨论,以减少今后的论文继续出现类似问题。

3.2.1P值问题:尽管中华医学会杂志社一直强调“应尽可能给出具体的P值”,但是风湿病学的论文中用“<”或“>”来表示者仍占绝大多数。曾对来审稿件和一些已,根据文章中所提供的资料(如病例数、均数、标准差等)进行复算,发现不少错误或欠缺。例如有些P值在0.05~0.1之间,却被写成<0.05;一个表中,多个组合的比较,作者用“为P值<0.05,为P值<0.01”,为P值<0.001”,复算的结果是“”的数值中有些P值是落在0.01~0.001之间或0.001以下。既然文章中已阐明统计学运算是采用统计软件,计算机运算的结果就肯定是具体的P值,因此论文没有理由不给具体的P值。只有当P值非常小,计算机运算结果显示的P值为0.000”时,论文中才标“P值<0.001”。

3.2.2注意相关强度及其95%可信区间的表示:临床研究的结果常常涉及到相关强度的运算,最常用的是OR值和RR值。有些已发表的论文,作者明明在统计学方法中说用Logistic同归或COX回归,但结果中却找不到OR值或RR值。相关强度及其95%可信区间的运算和意义己在前面几讲中讨论,这里不重复。值得一提的是,不少文章中OR值或RR值的95%可信区间包含了1,P值却<0.05,计算机肯定不会运算出这样的结果。

3.2.3数据必须与研究资料一致:少数论文的结果中,数据与研究资料相差太大。例如一篇长期随访的研究,在“材料与方法”中注明“为1985年1月至2000年12月”,而“结果”中的3个生存曲线图,均显示曲线右端到达25年,究竟是哪个环节出问题呢?

3.2.4避免违反科学的数据:不时见到一些违反科学的数据,使论文成为“垃圾”。例如一篇狼疮性肾炎长期随访的论文,将1组病人的两个结局(人生存率和肾脏生存率)的2条生存曲线描绘在一个坐标上,运用logrank检验,竟能“计算”出其χ2值和P值。计算机是不可能作这种运算的,因为这两条曲线不可能作差异性检验。

3.3全面描述本研究的问题凡是可以进行统计学处理的资料,都应尽量运用统计学处理。但有些资料则需要进行详细的陈述。应该说,该研究资料所能反映的各种结局都应该被陈述。例如,淘汰或失访病例的数量和主要原因;各种疗效和各种副作用;研究中出现的各种问题,包括意外的发现等等。有些意外事件的发生虽然不一定与本研究有直接联系,但也必须如实描述,然后在“讨论”中进行分析,陈述自己对这意外事件的观点。陈述必须客观,不要牵强,也不要讨论和主观推断。讨论和推断必须放到“讨论”中去。

4.讨论

图1所示,讨论部分呈梯形结构,提示这一部分需要根据研究的结果,结合文献的回顾,拓展开来分析讨论,以得出本研究的结论。

如果引言部分限于篇幅,无法详细介绍本项研究的背景和立论依据,则可以在讨论的第一段补充描述。需要注意的是,论文中不要轻易出现“首创”、“领先”或“过去未见报道”的字眼。如果确是如此,应该客观地陈述:用哪些词(如甲氨蝶呤和成人Still病)检索哪个数据库(如Medline或PubMed),检索的结果如何。因为从这些数据库中找不到的文献,不等于全世界就没有人报道过。客观地陈述检索结果,容易被人家接受,而且读者必要时也可以运用同样的策略,重复进行检索。

上一篇:财务会计理论论文范文 下一篇:合同法教学论文范文