浅谈考试成绩的差异显著性分析
浅谈考试成绩的差异显著性分析(精选3篇)
浅谈考试成绩的差异显著性分析 第1篇
浅谈考试成绩的差异显著性分析
【摘 要】本文尝试运用数理统计学中的显著性检验的基本思想和常用的excel软件简单介绍了考试成绩中班级之间、校际之间的平均分、优秀率、及格率的差异显著性检验,即U检验的计算方法与主要步骤;以及教改结题报告的成绩分析涉及各种检验方法――T检验、Z检验的区别及计算方法、主要步骤。简单而言,本文是用统计学中的检验方法科学地分析什么情况下两个平均分、优秀率、及格率“差别不大”,“差别明显”,“差很多”,希望能更加科学客观地分析两个均值间的差异,对有需要的老师有所帮助。
【关键词】成绩差异;U检验;T检验;excel软件
一、引言
在每次考试成绩统计中,平均分、及格率、优秀率依然是一个班级教学的主要考核指标,但由于这样或那样的原因,可能会有些学生缺考。特别是近年我市实行了中职技校春季招生政策,某些学校分流人数也许过半。如何才能科学地公平地进行统计分析,也是许多从事成绩分析与管理的老师面临的难题。
另外,在教改结题报告或阶段性小结中,总要会对教改效果进行分析,也就难免对对比班与实验班的考试成绩中平均分、及格率、优秀率等数据作显著性检验,来比较教改的效果是否明显或不明显。看了不少结题报告,其中涉及到的检验方法如U检验,Z检验,T检验等等,不一而足,让人摸不着头脑。即便是数学教师,由于在大学就读时的教学内容侧重点有所不同,或许对数理统计方面知识掌握不强,也很难明白这些检验方法孰是孰非,孰优孰劣,更别说非专业其它科目的教师。在作成绩对比分析时,通常无从下手,或是委托统计能力强的老师帮忙,或是随意给些似是而非的数据,抑或罗列考试成绩,直接对比,不作任何检验,也就缺乏科学严谨性。
二、班、级考试成绩差异显著性分析
有些学校以班和年级考试人数与注册人数比值作为相对系数对实考的分数进行了调整,其大致算法是:年级在册人数为N,缺考R人,某班在册人数为n,缺考r人,则相对系数为[(n-r)/n]/[(N-R)/N],用此系数乘以该班实际考试成绩,即为相对成绩,然后再以各班的相对成绩进行对比。这或许是一种方法,但这种调整,会对实考的成绩进行了放大或缩小,个人认为没有多少益处。事实上,一个班级本身或许也有人缺考,只不过没别班那么多,但平均分调整后可能偏离很多。
例1:一所学校九年级4个班,每个班注册人数均为50,在一次考试中,某班平均分60,缺考20人,全级缺考100人,按上述方法折算该班平均分。解: =60*[(50-20)/50]/[(200-100)/200]=72,这是不科学的,也没有什么意义。
1、样本均值与总体均值差异显著性检验(U检验)
要检查班级之间成绩是否相差太大,目的并不是要排出名次,可以采用U检验(有些文章也称Z检验,在ecxel软件中,相应的变量也是Z。为避免与下文混淆,只有总体方差未知,本文方用Z检验,且二者计算不同,故此不用此名称)。U检验的条件是:已知(或可以求出)样本均值、样本容量与总体均值、总体的标准差,可能采用U检验进行两均值异显著性检验。
统计学认为,不论x变量(考试分数)是连续型还是离散型,也无论x服从何种分布,一般只要样本容量(考试人数)n>20,就可认为平均值 的分布是正态的, ,则 ,服从标准正态分布,这就是进行U检验的理论依据。U检验主要步骤如下:
第一步,建立虚无假设,即先认为两者没有差异,用 表示
第二步,计算u统计量
U检验的统计量为 ,其中,
(a) = ( 为该班每一个学生的分数)是要检验班的平均分,excel软件的公式为:=AVERAGE(该班的成绩区域);
(b) = ( 为年级每一个学生的分数)是年级平均分,excel软件的公式为:=AVERAGE(年级的成绩区域);
(c) 为标准误, 年级标准差,计算公式是 = excel软件的公式为:=STDEV(年级的成绩区域);
(d)n为该班人数,excel软件的公式为:=COUNT(该班的成绩区域)。以上的数据均由学生考试成绩表统计得到。
从u统计量式子中我们看到,在两个平均分的差值进行标准化过程中,u值要受到年级标准差σ该班人数n影响。一般而言,就一次考试中n相对稳定,经开方后值更小,影响不大;而u值与σ成反比,换句话说,年级中各人成绩离散程度越大,两个平均分差值的差异就越不显著。
第三步,设定显著水平唬查表或计算接受域
检验前必须设定显著水平唬这是一个小概率数值,经常会选择=0.05,此时置信度1-=0.95,也即检验的结果有95%可靠性,有5%的不可靠,这个误差可能是由于偶然性造成的。在许多研究领域,0.05通常被认为是可接受错误的边界水平。如果有必要,也可选择=0.01,0.02等,使检验结果准确。由于标准正态分布图像是关于纵轴两边对称的,0.95对应的置信区间占据中间部分,而两侧共占0.05,一侧则占0.025,所以在计算或查表时,应以1-/2作为参数进行。如显著性水平=0.05,则查表或计算的是1-0.05/2=0.975对应的置信区间,excel软件的计算公式为:=NORMSINV(0.975),回车后得1.959963985,一般取近似数1.96。由于图像对称性,确定的置信区间为(-1.96,1.96),以这个区间为接受域。若令=0.01,则接受域(-2.578,2.578)。
第四步,观察统计量u值是否落在接受区域 ,由此对样本均值与总体均值作出显著性差异判断。如果u统计量在置信区间 (-1.96,1.96)内,接受H0,差异不显著,否则拒绝H0,差异显著;如果u统计量不在置信区间 (-2.578,2.578)内,则差异非常显著。
例2.甲班某次参加考试36人,平均分66,年级平均分60,标准差为20分,检验甲班平均分与年级平均分是否有显著性差异。 解:把相关数据代入 ,所以无显著性差异。有些人认为相差5分就差很多,看来也是不科学的。
2、标准分的计算
由于标准分是综合个体与总体分数排位等因素计算而来,因此标准分本身是经过差异分析得到的数值。值得一提的是,在计算高考或中考标准分中,excel的NORMSINV函数作用非常大,不用查标准正态分布表,而且数值十分精确。换算公式T=100Z+500,其中Z=NORMSINV(Pi), Pi为某名次以下的人数占考生总数的百分比,相当于1-/2。例如10000人考试,则第1名的标准分为T=100Z+500= 100*NORMSINV(9999/ 10000)+500 872。
3、班、级的及格率、优秀率的检验
在成绩分析时,及格率、优秀率也可以像平均分一那样进行显著性差异检验,那么这两项该如何进行呢?难点在于标准差怎么求。
其实,从公式看:平均分、及格率、优秀率三个数据的分母均为考试人数,三者均为平均值。平均分是每个人的分数之和/考试人数,由于每个人都会有一个分数,直接相加可得。那么及格率呢?表面看是及格率=及格人数/考试人数,在计算时,其实将每个人分数稍作处理:将达到及格的分数改为1,没达到的改为0,excel软件中可用公式=if(Ai>=60,1,0)及填充柄下拉简单得到,Ai为每个原始分数所在单元格,然后对转换后的数据求平均值(即及格率)与标准差了。然后把班、级的及格率代入u统计量式子中计算u值。优秀率也用相方法处理即可。
例2.乙班某次考试成绩如下:
87 64 71 81 75 72 87 46 54 61 50 42 65 50 79
72 43 68 64 64 60 48 87 48 52 56 54 50 48 62
92 70 82 53 82 73 75 72 68 70
求此次考试的及格率及对应的标准差。
解:按及格分数为1,不及格分数为0转换后为:
1 1 1 1 1 1 1 0 0 1 0 0 1 0 1
1 0 1 1 1 0 0 1 0 0 0 0 0 0 1
1 1 1 0 1 1 1 1 1 1
可以求出这组数据的平均值即及格率为=26/40=65%,标准差为S= =0.483。
年级的优秀率与及对应的标准差也如法炮制,再进一步如平均分一样代入u统计量式子中计算就可以进行分析检验。需要指出的是,有些资料计算方法并非如此,这可能是转换后的结果只有0、1两个,不少人会认为这组数据服从两点分布或二项分布,所以按两点分布求方差S2=p(1-p),在这里p可以是及格率或优秀率,像上例S= =0.4770,出入比较大,很明显这并不是两点分布。我认为每个人及格记1分,不及格记0分,班级的“平均数”就是及格率或优秀率,这样理解更自然,按上例方法求标准差及进行检验可能更科学。
4、U检验运用条件
在已知样本均值、样本容量及总体的均值及总体的标准差,在每次考试中,这几个数据还是比较容易得到的,u统计量服从标准正态分布,即可以进行U检验。U检验涉及的计算较为简单,把以上四个参数代入公式即得u统计量(如果u值为负则取绝对值),然后与临界值比较,一般以1.96或2.578为临界值,不再另外查表或计算,就可以分析样本均值与总体均值是否具有显著性差异,所以U检验在诸多领域运用广泛。
三、教改结题报告中的成绩分析(T检验,Z检验)
一般而言,教改成绩就是实验班与对比班两个班的成绩比较,能否仅凭这两个班的平均分、优秀率、及格率的差值,立即得出教学效果是否明显呢?统计学认为,这样得出的结论是不可靠的,因为一个班的平均分具有统计意义,存在抽样误差,此数据是在一定范围内波动的,故而我们需要进行显著性差异检验。由于一个班多则也就50多人,少则也有20多人;所以每个班都可以看成一个样本,两个班就可看成从两个总体中抽取出来的双样本,一个总体是实施了教改的,一个是没有实施教改的。当然,这两个总体在这种情形下更多是虚拟的,它们具体的一些数据(平均分,方差等)我们是无从知晓的,也就没有办法直接研究,只能通过研究样本(即实验班及对比班成绩),由样本的数据对总体进行估计,并进行差异显著性检验,才能作出判断。
1、Z检验与T检验的区别
不少文章对Z检验还是T检验这两种方法作出了说明,两个总体均值的差异显著性检验中,在不知总体方差及均值情况下且统计量服从t分布,可以使用Z检验或T检验。如果样本容量n大于30,用Z检验,如果样本容量n小于30,则用t检验,在这里样本容量n即为该班人数。很明显,正如前文所说,一个班的人数一般都在30人之上,可以用Z检验。但假如一个班30人以下,另一班30人以上那怎么办?其实在计算机广泛应用计算的今天,不管样本容量n是多少,哪种检验都是可以使用的,且各种检验的基本原理是相同的。下面,不妨先了解这两种检验方法的统计量。
首先,不论哪种检验都要用到以下数据:
(a)两个班的平均分: ;
(b)两个班的考试人数: ;
(c)两个班的成绩的方差 ,应用excel软件的公式为=var(该班的成绩区域),数量上,方差=标准差的平方。
t检验或z检验的主要步骤:
第一步,建立虚无假设,即先认为两者没有差异,用 表示
第二步:计算Z检验或T检验统计量
z= ①,t= ②(大分母部分称为标准误)。式子中, 是两个班的平均分, , 是两个班分数的方差, 是两个班考试人数。从函数单调性而言,不论z或t,与u值类似,当两班的方差增大时,其值减小,即两班均分所代表的两总体的均值的差值差异性也到受成绩离散程度影响。
另外,从式子结构看,t统计量要复杂很多,这在计算工具落后的过去,这个计算当然是很繁琐的。想当初,手中可能连计算器都没有,开个方都可能需要手算。据说数学家陈景润证明“1+2”时所用的草稿纸真的达到汗牛充栋地步,可堆满房子,如果换了今天,估计他的稿纸也许高不盈尺。所以我们可以认为,Z检验其实只是T检验的粗略计算而已,二者其实都可使用,只是t值过程稍复杂,但应更精确。 第三步 查表或计算临界值
在不知总体方差情形下,两个平均值差服从t分布,查表或计算t临界值要有两个参数,显著水平唬及自由度df。如果考查一个班,d ,如果进行两个班对比,自由度d 。计算临界值 ,excel软件中公式为:=TINV(唬df),若令=0.05,自由度从30至120,临界值 都约为2,详见下表:
自由度df 30 40 50 60 70 80 90 100 110 120
临界值t0 2.042 2.021 2.009 2.000 1.994 1.990 1.987 1.984 1.982 1.980
而两个班的人数基本上也在这个幅度内,像U检验一样,根据原始数据算出的t值与临界值 进行比较,为了简化运算, 可以取近似数2。
同样,在差异显著情形下,非要区别出相差很多,以令=0.01,自由度30至120主要的临界值 如下:
自由度df 30 40 50 60 70 80 90 100 110 120
临界值t0 2.750 2.704 2.678 2.660 2.648 2.639 2.632 2.626 2.621 2.617
第四步 比较t值或z值与 ,作出统计推断
与u检验类似,比较计算出来的t值或z值与临界值 ,如果|t|< =2或|z| < =2,则认为要检验的两个样本均值差异不明显,否则差异显著。
在报告中,不妨将各次考试成绩计算出来的t值用表格与图表形式展示出来,这样使数据条理更加清晰,也会使得内容更丰富,生动。
例3.某次考试原始成绩(满分100)如下:
实验班30人:
90 54 56 84 78 84 78 78 82 50 82 76 80 56 80
80 76 78 68 70 60 64 68 50 70 72 47 68 74 72
对比班40人:
70 72 72 54 66 64 90 68 50 62 60 54 50 95 56
52 60 50 52 50 60 62 87 48 52 56 54 50 48 48
66 62 70 70 82 60 64 64 62 58
经计算得,实验班平均分 ,方差 =132.3,对比班平均分 ,方差 =135.2;分别代入Z统计量及T统计量式子中得
z= = =3.255,
t=
= =3.25,二者差别不大,均大于临界值 =2,所以可以认为教改验效果明显。
2、及格率、优秀率的检验
很多教改老师在成绩分析时,主要是对实验班及对比班的平均分进行显著性差异检验,而及格率或优秀率的检验则很少人涉及,这或许不够全面。与U检验一样,对分数稍作转换,然后对处理后的两组数据像平均分显著性检验方法一样进行计算。
例3.如上述例子,作及格率差异显著性分析,及格的分数改为1,不及格的改为0,则两个班的分数表为:
实验班30人:
1 0 0 1 1 1 1 1 1 0 1 1 1 0 1
1 1 1 1 1 1 1 1 0 1 1 0 1 1 1
对比班40人:
1 1 1 0 1 1 1 1 0 1 1 0 0 1 0
0 1 0 0 0 1 1 1 0 0 0 0 0 0 0
1 1 1 1 1 1 1 1 1 0
算得实验班及格率: =80%,方差 0.251;对比班及格率: =57.5%,方差 0.166,代入式子
=2.01>2,同样及格率的检验差异显著性是明显的。同样方法也可以对优秀率进行检验。由于可以在excel表直接列表中用填充柄,计算极方便,此处不再赘言。
3、前后两阶段成绩自身对比分析
如果说,实验班与非实验班的成绩对比是横比的话,那么自身两次成绩的对比则是纵比。教改实验从开始接手到结束是一个过程,加上一个班学生的成绩也是一个动态变化,反映在教改期间的每一次在考试成绩,所以很有必要进行前后两阶段成绩自身对比分析。
其检验方法是:对每一名学生两次成绩求差, ,然后以所有的差作为样本数据进行分析。
统计量为 ,其中 为这组数据的标准差。
例4.如例1中实验班成绩为:
90 54 56 84 78 84 78 78 82 50
82 76 80 56 80 80 76 78 68 70
60 64 68 50 70 72 47 68 74 72
而前一次考试成绩为:
87 52 55 83 84 81 71 76 81 54
80 76 80 54 78 77 74 72 65 74
62 63 68 44 71 68 45 66 73 75
对应位置的两个数据为同一名学生两次成绩,对这两次成绩平均分的进行差异显著性检验。
解:两组对应位置的数据求差得:
3 2 1 1 -6 3 7 2 1 -4
2 0 0 2 2 3 2 6 3 -4
-2 1 0 6 -1 4 2 2 1 -3
计算得, =1.2 =2.93 df=30-1=29,计算 =2.045, 差异性显著,所以可以作出结论:教改效果明显。
同样,与平均分、及格率,优秀率一样,通过对动态的差值计算的t值也可以通过表格与图表表示出来,说明教改中实验班与对比班成绩差异是否显著,教学效果是否明显。
综上所述,在教改成绩分析中,不但要检验实验班与对比班的平均分差异显著性,还可以对两班及格率、优秀率差值进行检验,甚至对同一个班前后几次成绩进行检验,这样方能更科学地分析教改成效。
四、差异显著性分析的意义
不管是U检验还是T检验或其它检验,其计算方法都是两个均值的差除以标准误,然后与临界值比较,U检验的临界值 ,T检验的临界值在=0.05,自由度30至100时 ,然后作出差异显著性判断。超过甚至远远超过这个临界点是我们每一位教师所追求的目标。但是现实中,大多教师是达不到这个目标的,原因有很多,因篇幅关系此处不作分析,我想既然是教学改革是实验,当然就会存在失败,这是客观现象。我们应该更在乎过程,所以在成绩分析时,也就没有必要更改原始分数,非要达到“效果显著”。
以上笔者试图用统计知识,简单介绍了考试成绩中班级之间乃至校际之间的平均分、优秀率、及格率与的差异显著性检验,以及教改结题报告的成绩分析涉及各种检验方法,以期能对有需要的老师有所帮助,只是限于本人水平匮乏,文中必有许多不足之处,敬请各位给予指正为谢。
参考文献:
[1] 佚名《Excel常用函数大全》
[2] 邢航《独立样本均数差异的显著性检验及应用》 《中国集体经济》 第6期
[3] 郑巧玲 何以平《医学论文中t检验误用分析》 《中国科技期刊研究》01期
[4] 《平均数差异显著性检验统计检验力和效果大小的估计原理与方法》
[浅谈考试成绩的差异显著性分析]
浅谈考试成绩的差异显著性分析 第2篇
在现行的学校工作制度下, 一线的教师常常是担任一个班级的班主任, 同时又承担两个班级的教学任务. 在课时、教学内容、辅导次数、作业数量等内容基本相同的条件下, 考出的成绩从表面上看却有很大出入, 长此以往, 会产生一系列的不良反应, 如教师自我怀疑, 学生学习兴趣下降, 班主任之间互相猜忌, 从而影响到学校的教学质量. 本文以笔者实际所教两个班级的数学成绩为例, 从科学统计的角度, 对同师异班的两组成绩进行差异性研究, 介绍研究的方法和过程, 利用SPSS对数据进行计算, 并对结果解释说明, 为各方科学地看待考试成绩提供客观的依据.
二、基本理论简介
1. 独立样本t检验
独立样本t检验就是根据样本数据对两个样本所来自的总体的均值是否有显著差异进行推断. 使用独立样本t检验的前提条件是: 两样本相互独立; 两样本来自的总体均服从正态分布.
2. 独立样本t检验实现的基本思路
( 1) 正态性检验: 独立样本t检验需要数据的总体符合正态分布, 所以在进行t检验前要先对数据进行正态性检验, 使用最多的就是单样本的Kommogorov - Smirnov检验.
( 2) 提出假设: H 0 : μ 1 = μ 2 H 1 : μ 1 ≠μ2
( 3) 方差齐性检验: 对两个独立样本方差是否齐性, 要进行Levene F检验. 若F值所对应的p值 > 显著水平, 则认为两总体方差不等; 若F值所对应的p值 < 显著水平, 则认为两总体方差相等.
( 4) 选择t统计量并计算其值.
( 5) 统计决断. T检验的显著概率p > α, 则不能拒绝原假设, 即认为两总体均值不存在性显著差异; 否则, 反之.
三、基本操作步骤
( 1) 利用Excel建立数据文件. 先将两班的数学成绩放在两个变量中, 变量名分别为“成绩3”和“成绩4”, 保存为“正态检验. xls”; 再将两班的数学成绩都放在同一变量中, 变量名为“成绩”, 再用3和4来标志样本所属的班级, 变量名为“班级”, 保存为“t检验. xls”
( 2) 启动SPSS, 击文件/打开/数据命令, 载入“正态检验. xls”.
( 3) 击分析/非参数检验/旧对话框/1 - 样本K - S ( 1) ,
弹出对话框. 将变量成绩3和成绩4从左边的小白框中移到检验变量列表框内, 在检验分布栏内选择常规选项.
( 4) 点击确定键, 得到输出结果.
( 5) 结果说明: 4班的总样本数n =42; 正态分布的均值为57. 50, 标准差为24. 439; 实际频数与期望频数的最大差值为0. 114, 最大正极差为0. 114, 最小负极差为 -0. 067, 统计量k - s z =0. 742, z =0. 742 >0. 05, 故认为4班成绩服从正态分布. 同样, 3班的渐近显著性概率 ( 双侧) z = 0. 966 > 0. 05, 也认为3班成绩服从正态分布.
( 6) 击文件/打开/数据命令, 载入“t检验. xls”.
( 7) 击分析/比较均值/独立样本T检验 ( T) , 弹出对话框. 将变量成绩从左边的小白框中移到检验变量框内, 将变量班级移入分组变量框内, 并按该小框中下方的定义组, 弹出定义组设置框, 选择指定值 ( 这也是系统的默认值) , 在其下第一个组1小白框中输入数值4, 在第二个组2小白框中输入数值3, 然后点击继续键, 返回主对话框.
( 8) 点击确定键, 得到输出结果, 见图1.
四、总结说明
我们在图1中看到以下内容: ( 1) 方差齐性检验结果: F值为1. 552, 显著性概率为0. 217 >0. 05, 因此结论是两成绩方差差异不显著, 即可以认为两班成绩方差是相等的. 在下面的检验结果中应选择假设方差相等一行的数据作为本例的检验结果. ( 2) 均值相等的t检验结果: t值为1. 1; 自由度为76; 双侧t检验的显著概率为0. 275 >0. 05, 可以得出3、4班数学成绩没有显著差异; 两班成绩均值之差为5. 722; 差值的标准误差为5. 201; 差值的95% 置信区间在 -4. 636 - 16. 080之间.16. 080之间.
通过以上的比较分析, 可以有把握地说明在相同条件下, 笔者所教的两个班级的数学成绩没有显著差异, 不能仅从平均分去衡量孰强孰弱, 应科学评价考试成绩, 不骄不躁, 放平心态, 继续努力.
参考文献
[1]王孝玲.教育统计学 (第四版) [M].上海:华东师范大学出版社, 2001.
[2]杨善朝, 张军舰.SPSS统计软件应用基础[M].桂林:广西师范大学出版社, 2001.
浅谈考试成绩的差异显著性分析 第3篇
1 资料
1.1 资料种类
医学资料通常可分成计量资料、等级资料和计数资料3种类型。计量资料指连续的数据, 通常有具体的数值, 如血压、血红蛋白、血糖、生命体征等。等级资料指有一定级别的数据, 如临床疗效分为治愈、显效、好转、无效, 临床检验结果分为-、+、++、+++等, 等级资料又称为半定量资料。计数资料指各数据之间没有顺序或等级关系, 而是归于一定属性, 可以是2类, 也可以是多类。如抗原抗体检验资料, 按阳性与阴性各有多少例计数;如接受临床治疗资料, 按用试验药物、对照药物归类;如细胞分化资料, 按高分化、低分化、未分化归类计数等。计量资料可以转换为等级资料或计数资料, 而等级资料或计数资料无法转换成计量资料。因此, 在临床上收集数据时, 应尽量收集计量资料。
1.2 资料的分布类型
指资料的概率分布, 可简单地分为正态分布与非正态分布2种。正态分布是具有2个参数μ和σ的连续性随机变量的分布, μ是服从正态分布的随机变量的均值, σ是此随机变量的标准差, 所以正态分布可记作N (μ, σ) 。观测医学科研数据多数遵从正态分布, 如白细胞、红细胞、胆固醇、血压等。可用观测值的均值和标准差分别描述它的集中趋势和离散特性。观测值不遵从正态分布, 遵从其他类型的分布, 统称为非正态分布。对不能直接判断其变量分布类型者可以用以下方法判断: (1) 图示法:即通过图示大致了解观察资料是否服从正态分布, 此法较为粗糙; (2) 统计检验法:如W检验、D检验[1]。
2 计量资料的差异显著性检验
2.1 呈正态分布的计量资料分析
(1) 如为2组比较可用t检验。t检验有2种方法, 取决于资料是成组比较还是配对比较。医学科研中对每一名患者治疗前后的比较, 如应用利尿药后尿量前后比较, 应用保肝药后血清酶水平前后变化的比较等, 这些多属于配对比较。临床上许多研究无法配对, 如新药与对照药物的比较, 通常都是治疗组与对照组进行成组比较。在选用t检验时, 其检验的方法是不同的, 见表1。
注:*应用条件是数据呈正态分布, 方差齐性;**应用范围主要为数据呈偏态分布, 且数据无法转换为正态分布
(2) 对2组以上 (多组) 资料比较则选用方差分析, 方差分析也有2种方法, 取决于研究设计。如研究肺结核某化疗方案的疗程, 对100名肺结核患者按化疗方案治疗, 将每名患者治疗3、6、9、12个月后进行疗效观察, 以比较不同疗程间的差异, 不同疗程均来自同一患者, 这种设计称为随机区组设计, 需要用随机区组方差分析[2]。而如果我们的目的是研究3种不同化疗方案的治疗效果, 采用随机方法将患者分为3组, 每种方案应用于一组患者, 3组患者最终的疗效比较则用完全随机设计方差分析[2]。需要注意的是, 各组样本含量相等或不等, 其组间离均差平方和的计算方法略有差异。
配对或配伍组设计比完全随机设计的优点是:对干扰因素控制较好, 如上例4个时间段的治疗, 除了疗程外, 其余因素都一样 (来自同一患者) , 从而减少了偏倚误差, 提高统计效率。在进行方差分析时, 如对3种化疗方案疗效进行比较时, 若差异有统计学意义而推翻了无效假设, 这时并不能区分是哪2种疗法不同或3种疗法全不相同。有一种想法是不作方差分析而直接作3个t检验, 即检验A=B、A=C、B=C, 由此直接得出结论。这是不正确的, 因为它增加了第一类错误, 即假阳性的概率。比较合理的方法是在单因素方差分析[3]后作多重比较 (两两比较) , 多重比较的方法很多, 常用的有SNK法、Duncan法、LSD法等[1]。应用t检验和方差分析的前提是: (1) 小样本时, 无论t检验或方差分析, 对数据的要求均应是正态分布; (2) 成组t检验和方差分析要求各组的样本方差间无统计学意义 (方差齐性) 。2组方差齐性检验可以用F检验, 多组方差齐性检验可以用Bartlett检验、Levene法[2]。
2.2 呈非正态分布的计量资料分析
(1) 先进行数据转换。如果数据属于某种特殊分布或具有一定特征, 经过一定转换后可转换成正态或方差齐性, 再利用上述方法进行检验。如水中细菌数、单位时间放射性计数等符合Poisson分布, 数据可通过平方根转换;非传染病患病率、白细胞百分数、淋巴细胞转换率、钡条胃排空检查的残留率等符合二项分布, 数据可通过平方根反正弦函数转换;滴度资料等可通过对数转换。
(2) 非参数统计法。针对2组或多组计量资料的总体分布不能确定或没有适当的转换方法时, 可以用非参数统计法。非参数统计法比较的是分布而不是参数。它不考虑资料的分布类型, 而是直接用样本数据的符号、大小顺序号、综合判断划分的名次、严重程度或优劣等级等作比较。参数法难以处理的等级资料, 非参数法却能加以分析, 故其应用范围广。对于不同医学研究设计所得非参数资料, 其差异性检验各有不同方法。
3 等级资料的差异显著性检验
等级资料分组比较也应用于非参数检验, 多组比较时采用H检验[2], 如:3种复方小叶枇杷治疗老年慢性支气管炎疗效比较, 3组患者的疗效观察结果为控制、显效、好转、无效。2组比较时采用等级秩和检验[2]。如比较2种胃动力药物治疗功能性消化不良的疗效, 疗效评价按显效、有效、好转、无效分为4个等级, 2组比较可采用等级秩和检验。
4 计数资料的差异显著性检验
计数资料是研究2组或几组资料的性质或分类的特征, 通常用率或构成比描述各组的特征。其差异显著性假设检验的目的是比较组间率或构成情况间的差异是否有统计学意义。其常用方法有χ2检验和u检验, 根据临床研究设计的不同选择相应的方法。
4.1 四格表资料的χ2检验
4.1.1 完全随机设计两样本率的比较
当比较2组计数资料且资料的属性只有2种时, 通常采用χ2检验, 如:研究Hp (幽门螺旋杆菌) 感染与胃癌关系时, 胃癌病例组80例, Hp感染60例 (感染比例75%) ;慢性胃炎对照组80例, Hp感染40例 (感染比例50%) 。是否胃癌病例组Hp感染率高于慢性胃炎对照组, 即Hp感染与胃癌有关, 统计学检验时即可采用四格表χ2检验。四格表中如果数据较少, 理论数<5, 特别是总观察数<40时, 或有理论数<1时, 需要用精确 (Fisher) 检验法[2]。
4.1.2 配对设计的χ2检验
配对设计试验结果为“二分类”的计数资料, 如:对某病的筛查中, 用2种试剂对筛查对象分别化验, 其结果见表2, 问2种试剂筛查率有无差别。
4.2 行列表资料的χ2检验
四格表是最简单的一种行列表, 即22表。当比较组超过2组或者资料的属性超过2种时, 这类表格称行列表 (RC表) 。根据临床研究目的和所收集资料类型可以分为以下几种情况。
4.2.1 多个样本率的比较
如对病情相同病例随机分组用3种以上治疗方案处理 (见表3) , 比较其治疗效果 (治愈率或转阴率) 有无差异, 以对疾病治疗 (处理) 方法进行指导。
4.2.2 2个或多个构成比的比较
如检验不同疾病或不同人群其分类指标构成比差异有无显著性。如:某医院随机抽取肺癌和食管癌患者作为研究对象, 观察各自的生活习惯, 通过差异性假设检验, 以了解2种癌症可能的危险因素。在现况调查中常用到这种分析, 可以为疾病病因研究提供线索。
4.2.3 一个样本的分类变量关联性分析 (双向有序分类资料的
关联性研究[4]) 即对一组临床观察对象按照2种分类变量取值, 排成RC表。运用χ2检验分析两分类变量的关系。如:对一组高血压患者按血压分型观察其冠心病发病情况, 以研究血压与冠心病之间的关系。
4.2.4 一个分层样本或连续性资料的趋势性检验[1]当率是按自
然顺序的等级分层或者在连续性资料等级化后再分层的情况下, 运用此法以分析率随该分层变化的趋势。如研究呼气末正压通气 (PEEP) 治疗成人呼吸窘迫综合征 (ARDS) 时, 不同氧压变化与治疗效果趋势的推测可用此法。
4.3 u检验
当样本含量n足够大, 且样本p和 (1-p) 均不太小, 即np和n (1-p) 均大于等于5时, 且数据呈正态分布或近似正态分布。这时, 两率差异的假设检验可以用u检验。
4.3.1 样本率与总体率比较
如:2002~2003年, 对3 828例哈尼族居民进行血压测定及相关调查。共发现536例高血压患者, 哈尼族高血压患病率约为14.00%[5], 与1991年全国高血压普查患病率11.29%进行两率差异显著性检验。
4.3.2 两样本率比较
用于推断两样本分别代表的未知总体率差异是否具有显著性。如2种药物治疗同种疾病的治疗效果比较时, 即可用u检验对两样本治愈率的差异进行比较。
医学科研结果的准确性除了与正确选择检验方法有关外, 还与正确的研究设计、收集资料的合理方法有关。因此, 统计方法应当在研究设计阶段作出正确的选择, 而不是等到数据收集好之后再来考虑。如果单纯依赖统计学方法, 对研究设计存在的选择性偏差和测量性偏差就无法补救, 科研结果的可信度就受到怀疑。
摘要:从资料类型分析入手, 通过实例说明如何正确选用医学统计学中常用的差异显著性检验方法, 推断出正确的结论, 以提高科研后期处理的科学性。
关键词:医学科研,医学统计学,差异显著性检验
参考文献
[1]倪宗瓒.医学统计学[M].北京:高等教育出版社, 2003.
[2]孙振球.医学统计学[M].北京:人民卫生出版社, 2002.
[3]傅华.预防医学[M].北京:人民卫生出版社, 2004.
[4]鈡才高.预防医学[M].北京:高等教育出版社, 2003.
浅谈考试成绩的差异显著性分析
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。