中国高校课件下载中心 》 教学资源 》 大学文库

《心理统计学》课程授课教案(讲稿)第八章 单因素方查分析

文档信息
资源类别:文库
文档格式:DOC
文档页数:11
文件大小:597.5KB
团购合买:点击进入团购
内容简介
《心理统计学》课程授课教案(讲稿)第八章 单因素方查分析
刷新页面文档预览

第八章单因素方差分析问题在前面的章节中我们介绍了两样本均数差异比较的1检验。但是心理学研究的人的行为非常复杂,往往需要对2组以上的样本均数进行比较。例如在一所国际性大学抽取一定的样本学生进行一次文化公平的智力测试,需要比较来自多个不同国家的学生得分是否存在差异?这里涉及到了两个以上样本均数的比较,如果我们继续使用t检验方法对每一对平均数的差异进行一一比较,将会增加I型错误。本章将介绍的方差分析(AnalysisofVatiance,ANOVA)就是用来解决两个以上样本均数比较问题的。方差分析是借助对变异的分解来比较两个及两个以上样本均数,而变异的分解往往与试验设计类型联系在一起。所以,根据不同的试验设计类型,方差分析根据研究处理因素个数的多少可以分为单因素方差分析(one-wayANOVA)和多因素方差分析(multivariateANOVA)。单因素方差分析是研究同一研究因素的不同水平下,各组样本均数间的差异是否具有统计学意义。多因素方差分析研究多个研究因素下,各组样本均数间的差异是否具有统计学意义。本章重点介绍单因素方差分析。学习目标1.掌握方差分析的基本思想2.了解方差分析中因素、处理和水平的概念3.掌握完全随机设计资料的单因素方差分析4.掌握随机区组设计资料的方差分析5.掌握多个样本均数间的多重比较6.应用SPSS进行方差分析7.了解方差分析的结果解释8.了解方差分析对数据的要求或应用条件第一节完全随机设计资料的方差分析一、完全随机设计思想完全随机设计是指遵循随机化的原则,随机抽取研究对象并将其随机分配到k个处理组,每组分别接受不同的处理。试验结束后,比较各个处理组之间的差异是否具有统计学意义,推论处理因素的效应。如例8-1就是完全随机设计的资料,它将数据按照一个处理因素(指导措施)进行分组整理,属于单因素方差分析。二、方差分析的基本原理样本均数间之所以有差别,可能有两种原因造成:首先它必然有随机误差(包括个体间变异)的影响:其次,如果各组接受的不同处理(treatment)方法产生的不同作用效应。方差分析的基本思想就是把全部观察值之间的变异一一总变异按设计和需要分解成两个或多个组成部分,再作分析。我们通过例8-1的数据来详细说明方差分析的基本思路。例8-1为研究详尽复述(elaboratedrehearsal)在记忆中的作用,某研究者随机抽取了181

1 第八章 单因素方差分析 问题 在前面的章节中我们介绍了两样本均数差异比较的 t 检验。但是心理学研究的人的行为非常复 杂,往往需要对 2 组以上的样本均数进行比较。例如在一所国际性大学抽取一定的样本学生进行一 次文化公平的智力测试,需要比较来自多个不同国家的学生得分是否存在差异?这里涉及到了两个 以上样本均数的比较,如果我们继续使用 t 检验方法对每一对平均数的差异进行一一比较,将会增加 I 型错误。本章将介绍的方差分析(Analysis of Vatiance, ANOVA)就是用来解决两个以上样本均 数比较问题的。 方差分析是借助对变异的分解来比较两个及两个以上样本均数,而变异的分解往往与试验设计 类型联系在一起。所以,根据不同的试验设计类型,方差分析根据研究处理因素个数的多少可以分 为单因素方差分析(one-way ANOVA)和多因素方差分析(multivariate ANOVA)。单因素方差分析是 研究同一研究因素的不同水平下,各组样本均数间的差异是否具有统计学意义。多因素方差分析研 究多个研究因素下,各组样本均数间的差异是否具有统计学意义。本章重点介绍单因素方差分析。 学习目标 1. 掌握方差分析的基本思想 2. 了解方差分析中因素、处理和水平的概念 3. 掌握完全随机设计资料的单因素方差分析 4. 掌握随机区组设计资料的方差分析 5. 掌握多个样本均数间的多重比较 6. 应用 SPSS 进行方差分析 7. 了解方差分析的结果解释 8. 了解方差分析对数据的要求或应用条件 第一节 完全随机设计资料的方差分析 一、完全随机设计思想 完全随机设计是指遵循随机化的原则,随机抽取研究对象并将其随机分配到 k 个处理组,每组 分别接受不同的处理。试验结束后,比较各个处理组之间的差异是否具有统计学意义,推论处理因 素的效应。如例 8-1 就是完全随机设计的资料,它将数据按照一个处理因素(指导措施)进行分组 整理,属于单因素方差分析。 二、方差分析的基本原理 样本均数间之所以有差别,可能有两种原因造成:首先它必然有随机误差(包括个体间变异) 的影响;其次,如果各组接受的不同处理(treatment)方法产生的不同作用效应。方差分析的基本 思想就是把全部观察值之间的变异——总变异按设计和需要分解成两个或多个组成部分,再作分析。 我们通过例 8-1 的数据来详细说明方差分析的基本思路。 例 8-1 为研究详尽复述(elaborated rehearsal)在记忆中的作用,某研究者随机抽取了 18

个受试对象。按完全随机设计方案将他们随机分为三组,要求每组受试者都记忆10个生词,生词内容和难度对每组受试者都是一样的,但给予不同的指导:第一组的受试者可以通过反复朗读单词来记忆;第二组受试者可以通过查生词的意思来记忆:第三组受试者可以通过寻找生词之间的联系来记忆。在经过一段时间记忆后,要求被试者写出所记住的生词,得记住生词个数,结果如表8-1所示。试问不同指导措施在记忆中的作用是否相同?表8-1不同指导措施下各组被试者所记住的生词数第一组第二组第三组合计(i=l)(i=2)(i=3)5府510689(观察值)831065883835263843 ZXiEX(Zx)108656(N)18n,4.336.338.60x(X)6.29124252389Ex?(Zx2)855在表8-1中,用X代表观察值,XX,来表示第i个处理组的第j个观察值,i=1,2,..,k,j=1,2,..,n。n,为第i个处理组的例数,总例数为n,=N。X指第i个处理组的均数,X表示全部试验结果的均数。观察表8-1中各数据间的差异,可以发现以下三种变异:1.总变异全部观察值大小各不相等,其变异就称为总变异(totalvariation)。用SS总表示,其计算公式为各个观察值与总体均数的离均差平方和(sumofsquaresofdeviantfrommean),即:SSe =Z (X -X)(8-1)因为离均差平方和受到观察值个数多少的影响,观察的个数越多,离均差平方和就越大,因此,它与总例数N有关,具体的说与总的自由度有关。总自由度为:V总=V= N-1(8-2)2.组间变异由于各组处理不同所引起的变异称为组间变异(variationbetweengroups)。它反应了处理因素对不同组的影响,同时也包括了随机误差。用SS组间表示,其计算公式为:2

2 个受试对象。按完全随机设计方案将他们随机分为三组,要求每组受试者都记忆 10 个生词,生词内 容和难度对每组受试者都是一样的,但给予不同的指导:第一组的受试者可以通过反复朗读单词来 记忆;第二组受试者可以通过查生词的意思来记忆;第三组受试者可以通过寻找生词之间的联系来 记忆。在经过一段时间记忆后,要求被试者写出所记住的生词,得记住生词个数,结果如表 8-1 所 示。试问不同指导措施在记忆中的作用是否相同? 表 8-1 不同指导措施下各组被试者所记住的生词数 第一组 (i=1) 第二组 (i=2) 第三组 (i=3) 合计 Xij (观察值) 5 5 10 6 8 9 3 8 10 6 5 8 3 8 8 3 5 X I ∑Xi 26 38 43 ( X ) 108 i n 6 6 5 (N) 18 i x 4.33 6.33 8.60 ( X ) 6.29 2  Xi 124 252 389 ( 2 X ) 855 在表 8-1 中,用 X 代表观察值,Xij Xij 来表示第 i 个处理组的第 j 个观察值, i =1,2,.,k , j =1,2,., n 。 i n 为第 i 个处理组的例数,总例数为 i n = N 。 Xi 指第 i 个处理组的均数, X 表示全部试验结果的均数。 观察表 8-1 中各数据间的差异,可以发现以下三种变异: 1. 总变异 全部观察值大小各不相等,其变异就称为总变异(total variation)。用 SS总 表 示,其计算公式为各个观察值与总体均数的离均差平方和(sum of squares of deviant from mean), 即: SS总 = 2  ( ) X X − (8-1) 因为离均差平方和受到观察值个数多少的影响,观察的个数越多,离均差平方和就越大,因 此,它与总例数 N 有关,具体的说与总的自由度有关。总自由度为: v总 = v= N -1 (8-2) 2. 组间变异 由于各组处理不同所引起的变异称为组间变异(variation between groups)。 它反应了处理因素对不同组的影响,同时也包括了随机误差。用 SS 组间表示,其计算公式为:

SS组间=n, (Xi-x)(8-3)组间变异的自由度为:(8-4)V组间=k-1(式中k为组数)3.组内变异每个处理组内部的各个观察值也大小不等,与每组的样本均数X也不相同,这种变异称为组内变异(variationwithingroups)。组内变异只反映随机误差的大小,如个体差异、随机测量误差等。因此,又称为误差变异。用SS组内表示,即:SS组内=-(X,-X,)2(8-5)(8-6)组内变异的自由度为:组内=N-k数理统计可以发现三种变异及相应自由度的关系为:(8-8)SS总=SS组间+SS组内(8-8)V总=V组间+V组内由此可见,总变异可以被分解为组间变异和组内变异两部分,总自由度也可分解为组内自由度和组间自由度。由于组间变异反映处理的效应和随机误差的作用,组内变异反映随机误差的作用。因此,如果没有处理效应或者处理效应的作用没有发挥,组内变异的大小应该与组间变异相同,均反映随机误差的作用。如果处理效应的作用明显,则组内变异与组间变异之间就会不同。以上各部份离均差平方和只能反映变异的绝对大小。为了反映平均变异大小,须将各部份离均差平方和除以相应自由度,其结果称为均方(meansquare,MS),公式为:MS组间=SS祖间/v组间,MS组内=SS组内/v组内(8-9)两个均方值之比为F统计量:F=MS组间/MS组内(8-10)F值越接近1,反映组间变异与组内变异间无显著差异,处理效应的作用就越小。相反,F值越大,反应处理效应越大。但是,F值要大到什么程度才有明显的统计学意义呢?我们可以通过查F界值表得到相应的P值,然后根据事先设定的检验水准α进行统计推断。检验统计量F的计算可以整理成方差分析表见表8-2。表8-2完全随机设计资料方差分析表VSSMSF变异来源N-1总变异ZZ X,?-Ck-1组间变异(Ex,)?SS组间MS组间ZCMS组内V组间n,N-k组内变异ZE(X,-x)SS组内V组内3

3 SS组间 = i i n 2 ( ) Xi X − (8-3) 组间变异的自由度为: v组间 =k-1 (式中 k 为组数 ) (8-4) 3. 组内变异 每个处理组内部的各个观察值也大小不等,与每组的样本均数 Xi 也不相同,这 种变异称为组内变异(variation within groups)。组内变异只反映随机误差的大小,如个体差异、 随机测量误差等。因此,又称为误差变异。用 SS 组内表示,即: 2 ( ) ij i i j SS X X 组内 = −  (8-5) 组内变异的自由度为: v N k 组内 = − (8-6) 数理统计可以发现三种变异及相应自由度的关系为: SS总 = SS组间 + SS组内 (8-8) v总 = v组间 + v组内 (8-8) 由此可见,总变异可以被分解为组间变异和组内变异两部分,总自由度也可分解为组内自由度 和组间自由度。 由于组间变异反映处理的效应和随机误差的作用,组内变异反映随机误差的作用。因此,如果 没有处理效应或者处理效应的作用没有发挥,组内变异的大小应该与组间变异相同,均反映随机误 差的作用。如果处理效应的作用明显,则组内变异与组间变异之间就会不同。 以上各部份离均差平方和只能反映变异的绝对大小。为了反映平均变异大小,须将各部份离均 差平方和除以相应自由度,其结果称为均方(mean square,MS),公式为: MS 组间 =SS 组间/v 组间 ,MS 组内=SS 组内/v 组内 (8-9) 两个均方值之比为 F 统计量: F = MS组间 / MS组内 (8-10) F 值越接近 1,反映组间变异与组内变异间无显著差异,处理效应的作用就越小。相反,F 值 越大,反应处理效应越大。但是, F 值要大到什么程度才有明显的统计学意义呢?我们可以通过查 F 界值表得到相应的 P 值,然后根据事先设定的检验水准 α 进行统计推断。 检验统计量 F 的计算可以整理成方差分析表见表 8-2。 表 8-2 完全随机设计资料方差分析表 变异来源 v SS MS F 总变异 N -1 2 ij i j  X C− 组间变异 k-1 2 ( )ij j i i X C n −   SS v 组间 组间 MS MS 组间 组内 组内变异 N k − 2 ( ) ij i i j  X X − SS v 组内 组内

方差分析方法及理论由英国著名的统计学家R.A.Fisher创立。后人为了尊重他,以其名字的首字母来命名该方法所用的分布,称为F分布,故方差分析又称F检验(Ftest)。三、完全随机设计资料方差分析的基本步骤以例8-1介绍完全随机设计资料方差分析的基本步骤。1.建立假设检验和确定检验水准无效假设H。:μ=μ=μ,即3个试验组的总体均数相等备择假设H:川H2、,不全相等,即3个实验组的总体均数不全相等α=0.052.计算检验统计量F应用SPSS软件得到计算结果如表8一3所示:表8-3例8一1的方差分析结果MSSSF变异来源自由度P16总变异82.5349.662Fo00(214),P<0. 05。(2)应用SPSS软件直接获得P-0.01,即P<0.05。结论:按α=0.05,拒绝H。,接受H,认为3个处理组的总体均数不全相等,即不同的指导措施对记忆有影响。要深入了解哪两个处理组之间有无差别,需进一步作均数差异的多重比较,具体见本章第三节。四、方差分析相关知识1.方差分析的几个术语(1)因素(Factor):指影响因变量变化的自变量,如在例8-1有关记忆研究中,不同指导措施对记忆产生影响作用,指导措施就是一个因素。在进行方差分析时,因素通常作为分类变量出现。只有一个自变量的实验为单因素实验,对实验结果采用单因方差分析。有两个或两个以上自变量的实验为多因素实验,对实验结果采用多单因方差分析。4

4 方差分析方法及理论由英国著名的统计学家 R. A. Fisher 创立。后人为了尊重他,以其名字的 首字母来命名该方法所用的分布,称为 F 分布,故方差分析又称 F 检验(F test)。 三、完全随机设计资料方差分析的基本步骤 以例 8-1 介绍完全随机设计资料方差分析的基本步骤。 1. 建立假设检验和确定检验水准 无效假设 H0: 1 = 2 = 3 ,即 3 个试验组的总体均数相等 备择假设 H1: 1 、 2 、 3 不全相等,即 3 个实验组的总体均数不全相等  =0.05 2. 计算检验统计量 F 应用 SPSS 软件得到计算结果如表 8-3 所示: 表 8-3 例 8-1 的方差分析结果 变异来源 SS 自由度 MS F P 总变异 82.53 16 组间变异 49.66 2 24.83 10.91 F0.05(2,14) , P <0.05。 (2)应用 SPSS 软件直接获得 P=0.01,即 P <0.05。 结论:按  =0.05,拒绝 H0 ,接受 H1 ,认为 3 个处理组的总体均数不全相等,即不同的指导 措施对记忆有影响。 要深入了解哪两个处理组之间有无差别,需进一步作均数差异的多重比较,具体见本章第三节。 四、方差分析相关知识 1. 方差分析的几个术语 (1)因素( Factor ):指影响因变量变化的自变量,如在例 8-1 有关记忆研究中,不同指导措 施对记忆产生影响作用,指导措施就是一个因素。在进行方差分析时,因素通常作为分类变量出 现。只有一个自变量的实验为单因素实验,对实验结果采用单因方差分析。有两个或两个以上 自变量的实验为多因素实验,对实验结果采用多单因方差分析

(2)水平(Level):因素的不同情况或不同等级称为水平。例如,性别因素在一般情况下包括男、女两个水平,教学方法通常有传统讲授法、自学辅导法、启发探究法等三个水平。在例8-1指导措施因素有朗诵法、理解记忆、联系记忆三个水平。(3)实验处理(Treatment):指多个因素各个水平之间的组合。例如某研究中的因素有性别,取值为1(男)、2(女):还有年级grade,分三个水平:1(初一)、2(初二)、3(初三)。两个变量的组合共可组成6个处理:[1,1]、[1,2]、[1,3]、[2,1]、[2,2]、[2,3],分别代表两种性别与3个年级的6种组合。对于单因素实验数据来说,一个水平就是一种处理。2.方差分析的应用条件与t检验一样,方差分析作为一种参数检验方法,对数据也有要求:(1)样本必须来自正态分布的总体,即每一组内的观察值应该服从正态分布。当样本例数较多的情况下,数据可以近似看作服从正态分布。如果数据有明显的偏离,可通过变量变换的方法加以改善。(2)各组资料总体方差相等,即各总体具有方差齐性(homogeneityofvariance),样本所在总体的方差关系为:0,=2=の3O。(3)各次观察独立,即任何两个观察值之间没有系统相关性。3.方差分析与t检验的区别(1)t检验是用来检验两样本均数差异是否有统计学意义的一种检验方法。当面对两组以上的样本均数比较时,如果继续采用t检验分别对其进行两两比较,则不仅会大幅度增加比较的次数,更严重的是会增加犯I型错误的概率。如例8-1以上资料我们能否用前面所学的两样本t检验进行两两比较(即分别用第一组与第二组、第二组与第三组,第一组与第三组作3次两两比较的t检验)而得出正确的结论呢?答案是不能。因为对数据做的t检验越多,我们更容易犯I型错误。在一次检验中,α=0.05意味着最大容许犯I型错误的可能性是0.05,不犯I型错误的概率则是1一0.05=0.95。但是如上述过程进行3次t检验的比较,每次都有α=0.05的显著性水平的话,此时不犯I型错误的可能性就变为0.95×0.95=0.90,那犯I型错误的概率则增加为1一0.90=0.1。这个过程实际上扩大犯I型错误的概率。如果采用上述思路进行两样本比较的t检验,即10个样本每两个进行比较,其比较次数为k!_ k(k-1) _ 10(101) = 45m=222(k-2)!2当α=0.05时,在45次的比较中,有5次有统计学意义,那么其实际犯I型错误的概率为5/45~0.11,远远大于最大容许概率0.05。由此可见,在运用t检验时,随着其组合次数的增多,犯I型错误的概率就增加,统计推论可靠性的概率就较低。根据方差分析基本原理,方差分析不仅可以对两组及两组以上的样本均数同时进行比较,同时也可以始终在设定的检验水准下进行统计推论。这也是方差分析的优点。(2)当进行两组样本均数的比较时,我们不仅可以用方差分析的方法,还可以用t检验。统计学家已经证明当K=2时,对同一个资料,F=t。但是两者又有不同:t分布是对称分布,n越大,越接近于正态分布。因此,t检验是有方向性的双侧检验。而F分布属于偏态分布,方差分析是无方向性的单侧检验。例如,当K=2时,自由度为20的t分布和自由度为1和20的F分布。设定αa=0.05,此时t值分布在曲线的两侧,分别为一2.086和2.086。而F值只分布在曲线上的一侧,为4.35。这是为什么呢?因为,分布是根据均数的差值建立的曲线,而F分布是根据均数的方差建立的。均数之间的差值可以正数,也可以是负数,所以分布是对称分布。而均数的方差只有正数,n

5 (2)水平(Level):因素的不同情况或不同等级称为水平。例如,性别因素在一般情况下 包括男、女两个水平,教学方法通常有传统讲授法、自学辅导法、启发探究法等三个水平。在 例 8-1 指导措施因素有朗诵法、理解记忆、联系记忆三个水平。 (3)实验处理(Treatment):指多个因素各个水平之间的组合。例如某研究中的因素有性别, 取值为 1(男)、2(女);还有年级 grade,分三个水平:1(初一)、2(初二)、3(初三)。两个变量的组 合共可组成 6 个处理:[1,1]、[1,2]、[1,3]、[2,1]、[2,2]、[2,3],分别代表两种性别与 3 个年 级的 6 种组合。对于单因素实验数据来说,一个水平就是一种处理。 2. 方差分析的应用条件 与 t 检验一样,方差分析作为一种参数检验方法,对数据也有要求: (1)样本必须来自正态分布的总体,即每一组内的观察值应该服从正态分布。当样本例数较多 的情况下,数据可以近似看作服从正态分布。如果数据有明显的偏离,可通过变量变换的方法加以 改善。 (2)各组资料总体方差相等,即各总体具有方差齐性(homogeneity of variance),样本所在 总体的方差关系为:    1 2 3 = = . k 。 (3)各次观察独立,即任何两个观察值之间没有系统相关性。 3. 方差分析与 t 检验的区别 (1)t 检验是用来检验两样本均数差异是否有统计学意义的一种检验方法。当面对两组以上的 样本均数比较时,如果继续采用 t 检验分别对其进行两两比较,则不仅会大幅度增加比较的次数, 更严重的是会增加犯 I 型错误的概率。如例 8-1。 以上资料我们能否用前面所学的两样本 t 检验进行两两比较(即分别用第一组与第二组、第二 组与第三组,第一组与第三组作 3 次两两比较的 t 检验)而得出正确的结论呢?答案是不能。因为 对数据做的 t 检验越多,我们更容易犯 I 型错误。在一次检验中,α=0.05 意味着最大容许犯 I 型 错误的可能性是 0.05,不犯 I 型错误的概率则是 1-0.05 = 0.95。但是如上述过程进行 3 次 t 检验 的比较,每次都有α=0.05的显著性水平的话,此时不犯I型错误的可能性就变为0.95×0.95=0.90, 那犯 I 型错误的概率则增加为 1-0.90 = 0.1。这个过程实际上扩大犯 I 型错误的概率。如果采用 上述思路进行两样本比较的 t 检验,即 10 个样本每两个进行比较,其比较次数为: ! ( 1) 10(10 1) 45 2( 2)! 2 2 k k k m k − − = = = = − 当 α=0.05 时,在 45 次的比较中,有 5 次有统计学意义,那么其实际犯 I 型错误的概率为 5/45 ≈0.11,远远大于最大容许概率 0.05。由此可见,在运用 t 检验时,随着其组合次数的增多,犯 I 型错误的概率就增加,统计推论可靠性的概率就较低。根据方差分析基本原理,方差分析不仅可以 对两组及两组以上的样本均数同时进行比较,同时也可以始终在设定的检验水准下进行统计推论。 这也是方差分析的优点。 (2)当进行两组样本均数的比较时,我们不仅可以用方差分析的方法,还可以用 t 检验。统计 学家已经证明当 K=2 时,对同一个资料,F=t 2。但是两者又有不同:t 分布是对称分布,n 越大, 越接近于正态分布。因此,t 检验是有方向性的双侧检验。而 F 分布属于偏态分布,方差分析是无 方向性的单侧检验。例如,当 K=2 时,自由度为 20 的 t 分布和自由度为 1 和 20 的 F 分布。设定 α =0.05,此时 t 值分布在曲线的两侧,分别为-2.086 和 2.086。而 F 值只分布在曲线上的一侧, 为 4.35。这是为什么呢?因为, t 分布是根据均数的差值建立的曲线,而 F 分布是根据均数的方差 建立的。均数之间的差值可以正数,也可以是负数,所以 t 分布是对称分布。而均数的方差只有正数

所以没有方向性。第二节随机区组设计资料的方差分析一、随机区组设计思想随机区组设计(randomizedblockdesign),又称为配伍组设计,是配对设计的扩展。它应用分层的思想,事先按照影响试验结果的非处理因素,如年龄、性别、体重、职业等特征,将全部受试对象分成若干个区组(block),每个区组内研究对象的特征尽可能一致。每个区组内的研究对象数与研究因素的水平数相等,并分别使每个区组内的研究对象随机地接受研究因素某一水平的处理。与完全随机设计相比,随机区组设计的每个区组都要进行随机分配,所以重复随机分配的次数较多。同时,由于区组内的个体特征较一致,减少了个体间差异对研究结果的影响。因此,一般而言,比完全随机设计更容易检验处理组间的差别。它在变异分解中表现为将区组变异离均差平方和从完全随机设计的组内离均差平方和中分离出来,从而减少组内离均差平方和,提高统计检验效率。例8-2为研究不同的唤醒水平下完成相同难度任务的作业成绩是否有差异,在同一个城市中随机选取6个学校,在每个学校同一年级(如六年级)的学生中随机抽取3名被试者。让他们在一定时限内,接受3种不同的唤醒水平下完成适宜的相同难度的任务,记录其成绩,见表8-4。表8-46个区组学生在不同唤醒水平下完成相同难度任务的成绩唤醒水平分组x.低中高区组881018.6829898.3335866.3368846.6889598.68968108.68ZX,EXi434653142x8.188.689.338.89Zxizxu3193504851145从表8-4中可以看出,各观察值之间,各观察值与总体均数,各组内观察值和该组的均数之间都不相同。因此,根据变异的来源,将这些差异归结为总变异,不同学校之间的变异,不同唤醒水平下的变异和随机误差。因此,随机区组设计的总变异可以分解为几个部分:1.总变异SS:所有被试者的成绩之间的变异。2.处理间变异SS处理:各区组间的成绩均数互不相同,与成绩总体均数也不相同。这是由于唤醒水平的不同和随机误差产生的变异6

6 所以没有方向性。 第二节 随机区组设计资料的方差分析 一、随机区组设计思想 随机区组设计(randomized block design),又称为配伍组设计,是配对设计的扩展。它应用 分层的思想,事先按照影响试验结果的非处理因素,如年龄、性别、体重、职业等特征,将全部受试 对象分成若干个区组(block),每个区组内研究对象的特征尽可能一致。每个区组内的研究对象数 与研究因素的水平数相等,并分别使每个区组内的研究对象随机地接受研究因素某一水平的处理。 与完全随机设计相比,随机区组设计的每个区组都要进行随机分配,所以重复随机分配的次数较多。 同时,由于区组内的个体特征较一致,减少了个体间差异对研究结果的影响。因此,一般而言,比 完全随机设计更容易检验处理组间的差别。它在变异分解中表现为将区组变异离均差平方和从完全 随机设计的组内离均差平方和中分离出来,从而减少组内离均差平方和,提高统计检验效率。 例 8-2 为研究不同的唤醒水平下完成相同难度任务的作业成绩是否有差异,在同一个城市中 随机选取 6 个学校,在每个学校同一年级(如六年级)的学生中随机抽取 3 名被试者。让他们在一 定时限内,接受 3 种不同的唤醒水平下完成适宜的相同难度的任务,记录其成绩,见表 8-4。 表 8-4 6 个区组学生在不同唤醒水平下完成相同难度任务的成绩 区组 唤醒水平分组 低 中 高 Xi 1 8 8 10 8.68 2 9 8 9 8.33 3 5 6 8 6.33 4 6 8 8 6.68 5 8 9 9 8.68 6 8 9 10 8.68 Xij ∑Xij 43 46 53 142 Xi 8.18 8.68 9.33 8.89 2 Xij ∑X 2 ij 319 350 485 1145 从表 8-4 中可以看出,各观察值之间,各观察值与总体均数,各组内观察值和该组的均数之间 都不相同。因此,根据变异的来源,将这些差异归结为总变异,不同学校之间的变异,不同唤醒水 平下的变异和随机误差。因此,随机区组设计的总变异可以分解为几个部分: 1. 总变异 SS总 :所有被试者的成绩之间的变异。 2. 处理间变异 SS处理 :各区组间的成绩均数互不相同,与成绩总体均数也不相同。这是由于唤 醒水平的不同和随机误差产生的变异

3.区组间变异SS区组SS区组:由于不同的区组作用(即按学校分组)和随机误差产生的变异。4.误差变异SS误差:完全由随机误差产生的变异。检验统计量计算可以整理成方差分析表,如表8-3所示。表8-5随机区组设计方差分析表SSVMSF变异来源N-1总变异EE x,-C1处理间变异k-1(Ex,)SS处理MS处理Z-CMS误差V组间n,n-1区组间变异SS区组MS区组1Z(Zx,)-ck MS误差V区组误差(k-1) (n-1)SS总—SS组间—SS区组二、随机区组设计资料例和方差分析步骤1.建立假设检验和确定检验水准无效假设H。:μ=μ=μ,即在3种不同水平的唤醒下完成相同难度任务的成绩总体均数相等。备择假设H:μ、"2、",不全相等,即3种不同水平的唤醒下完成相同难度任务的总体均数不全相等。α=0. 05上述检验假设是关于处理因素不同水平之间的差别,如果要检验区组间的差别,也可按照上述的步骤进行,提出:H。:6个不同学校的学生完成相同难度任务的总体均数相等。H:6个不同学校的学生完成相同难度任务的总体均数不全相等。α=0.052.计算检验统计量F应用SPSS软件得到计算结果,如表8-6所示。3.确定P值,作出统计推断结论。(1)查表确定P值:按α=0.05水准,V处理=2、V误差=10,查F界值表,得F0.05(2,10)=4.10F =6. 08> Fo.05(2,14),P<0.05。7

7 3. 区组间变异 SS 区组 SS区组 :由于不同的区组作用(即按学校分组)和随机误差产生的变异。 4. 误差变异 SS误差 :完全由随机误差产生的变异。 检验统计量计算可以整理成方差分析表,如表 8-3 所示。 表 8-5 随机区组设计方差分析表 变异来源 SS v MS F 总变异 2 ij i j  X C− N -1 处理间变异 2 ( )ij j i i X C n −   k-1 SS v 处理 组间 MS MS 处理 误差 区组间变异 1 2 ( )ij j i X C k   − n −1 SS v 区组 区组 MS MS 区组 误差 误差 SS总 - SS组间 - SS区组 (k-1)( n −1 ) 二、随机区组设计资料例和方差分析步骤 1. 建立假设检验和确定检验水准 无效假设 H0: 1 = 2 = 3 ,即在 3 种不同水平的唤醒下完成相同难度任务的成绩总体均数 相等。 备择假设 H1:1 、2 、3 不全相等,即 3 种不同水平的唤醒下完成相同难度任务的总体均数 不全相等。  =0.05 上述检验假设是关于处理因素不同水平之间的差别,如果要检验区组间的差别,也可按照上述 的步骤进行,提出: H0:6 个不同学校的学生完成相同难度任务的总体均数相等。 H1:6 个不同学校的学生完成相同难度任务的总体均数不全相等。  =0.05 2. 计算检验统计量 F 应用 SPSS 软件得到计算结果,如表 8-6 所示。 3. 确定 P 值,作出统计推断结论。 (1)查表确定 P 值:按  =0.05 水准, v处理 =2、v误差 =10,查 F 界值表,得 F0.05(2,10) =4.10 F =6.08> F0.05(2,14) , P <0.05

(2)应用SPSS软件直接获得P值,本例处理组间变异和区组间变异的P值均<0.05。结论:按μαα=0.05,拒绝H。,接受H,,认为在3种不同的唤醒水平下完成相同难度任务的总体均数不全相等,即不同的唤醒水平对完成相同难度的任务有影响。6个不同学校的学生完成相同难度任务的总体均数不全相等。要深入了解哪两个处理组之间有无差别,需进一步作两两比较。表8-6例8一2资料的方差分析表VMS变异来源SSFP18总变异33.882处理间变异8.884.396.08<0.0553.56区组间变异18.884.92<0.0510误差8.220.82在随机区组设计的资料中,区组因素应该是对试验结果有影响的非处理因素。区组内的研究对象之间的特征差异力求一致,区组间的差异则越大越能体现区组的作用,更好地控制非处理因素的影响,提高检验的效率。值得指出的是,尽管在随机区组的数据分析时,我们往往采用两因素方差分析。这是因为,如果我们将区组作为另一个处理因素的不同水平时,随机区组设计就等同于无重复观察的两因素实验设计。但是它只是通过改进实验设计方法,减少实验误差。在实验中涉及的处理因素仍只有一个。第三节多个样本均数间的多重比较在完全随机设计资料和随机区组设计资料的方差分析中,当结果为拒绝B,接受H时,只能说明各总体均数不全相同,并未提供组与组之间比较的信息。如例8-1和8-2,都只说明各组的总体均数不全相等,而没有对具体每两组总体均数是否相等作出比较。因此,为了进一步说明处理因素不同水平的作用程度,需要具体分析到底是哪两个组之间的总体均数不相同。此时,即需要作进步的两两多重比较。那我们能否用已学过的两样本均数比较的检验来进行多重比较吗?正如我们在介绍方差分析与检验的区别时所指出的那样,用(检验进行两两比较将会加大犯I型错误的概率。因此通常采用两两比较的方法,如多重比较,线性对比,正交对比等,其中,最常用的是多重比较,它又可以进一步可分以下两种情形:1.在研究设计阶段未预先考虑或预料到,经假设检验得出多个总体均数全不等的提示后,才决定的多个均数的两两事后比较。这类情况常用于探索性研究,往往涉及到每两个均数的比较。可采用SNK-q检验、Bonfferonit检验。Sidakt检验等:2.在设计阶段就根据研究目的或专业知识而计划好某些均数间的两两比较。它常用于事先有明确假设的证实性研究,如多个处理组与对照组的比较,某一对或某几对在专业上有特殊意义的均数间的比较等。可采用LSD-t检验、Dunnett-t检验等,也可以用Bonfferonit检验、Sidakt检验。下面介绍三种较为常用的多重比较方法:SNK-q检验、LSD-t检验和Dunnett-t检验。一、SNK-q检验1.SNK-g检验统计量SNK是Students-Newman-Keuls三人姓氏的缩写,其检验统计量为q,8

8 (2)应用 SPSS 软件直接获得 P 值,本例处理组间变异和区组间变异的 P 值均<0.05。 结论:按 Σμα  =0.05,拒绝 H0 ,接受 H1 ,认为在 3 种不同的唤醒水平下完成相同难度任 务的总体均数不全相等,即不同的唤醒水平对完成相同难度的任务有影响。6 个不同学校的学生完 成相同难度任务的总体均数不全相等。要深入了解哪两个处理组之间有无差别,需进一步作两两比 较。 表 8-6 例 8-2 资料的方差分析表 变异来源 SS v MS F P 总变异 33.88 18 处理间变异 8.88 2 4.39 6.08 <0.05 区组间变异 18.88 5 3.56 4.92 <0.05 误差 8.22 10 0.82 在随机区组设计的资料中,区组因素应该是对试验结果有影响的非处理因素。区组内的研究对 象之间的特征差异力求一致,区组间的差异则越大越能体现区组的作用,更好地控制非处理因素的 影响,提高检验的效率。值得指出的是,尽管在随机区组的数据分析时,我们往往采用两因素方差 分析。这是因为,如果我们将区组作为另一个处理因素的不同水平时,随机区组设计就等同于无重 复观察的两因素实验设计。但是它只是通过改进实验设计方法,减少实验误差。在实验中涉及的处 理因素仍只有一个。 第三节 多个样本均数间的多重比较 在完全随机设计资料和随机区组设计资料的方差分析中,当结果为拒绝 H0,接受 H1 时,只能说 明各总体均数不全相同,并未提供组与组之间比较的信息。如例 8-1 和 8-2,都只说明各组的总体 均数不全相等,而没有对具体每两组总体均数是否相等作出比较。因此,为了进一步说明处理因素 不同水平的作用程度,需要具体分析到底是哪两个组之间的总体均数不相同。此时,即需要作进一 步的两两多重比较。那我们能否用已学过的两样本均数比较的 t 检验来进行多重比较吗?正如我们在 介绍方差分析与 t 检验的区别时所指出的那样,用 t 检验进行两两比较将会加大犯 I 型错误的概率。 因此通常采用两两比较的方法,如多重比较,线性对比,正交对比等,其中,最常用的是多重比较, 它又可以进一步可分以下两种情形: 1. 在研究设计阶段未预先考虑或预料到,经假设检验得出多个总体均数全不等的提示后,才决 定的多个均数的两两事后比较。这类情况常用于探索性研究,往往涉及到每两个均数的比较。可采 用 SNK- q 检验、Bonfferoni t 检验。Sidak t 检验等; 2. 在设计阶段就根据研究目的或专业知识而计划好某些均数间的两两比较。它常用于事先有明 确假设的证实性研究,如多个处理组与对照组的比较,某一对或某几对在专业上有特殊意义的均数 间的比较等。可采用 LSD-t 检验、Dunnett-t 检验等,也可以用 Bonfferoni t 检验、Sidak t 检验。 下面介绍三种较为常用的多重比较方法:SNK-q 检验、LSD-t 检验和 Dunnett-t 检验。 一、SNK-q 检验 1. SNK- q 检验统计量 SNK 是 Students-Newman-Keuls 三人姓氏的缩写,其检验统计量为 q

又称为q检验。它属多重极差检验(multiplerangetest),适用于多个样本均数间每两个均数之间的全面比较。检验统计量9计算公式为:(x-x)(8-10)9-SaMS误差(一+)(8-11)Sa=2nng通过计算得到g值,根据组间跨度α、误差自由度v误差和检验水准α查q界值表。当q≥qa(a,)时,拒绝无效假设,认为两组在给定的α水准下具有统计学意义。反之,不拒绝无效假设。2.检验步骤例8-3例8-1资料经F检验推论组间差异有统计学意义,问3种不同的指导方式对记忆的影响效果两两之间是否有差别?(1)建立检验假设,确立检验水准H。:μA=μg,即任两对比较组的总体均数相等。H:μA≠μg,即任两对比较组的总体均数不相等。α=0.05(2)计算检验统计量经计算得到q检验结果如表8-7所示:表8-7例8-1三个样本均数两两比较的q值表两均数之对比组内包qq临界值对比组差含组数pA与BXA-Xe0.050.01a(1)(2)(3)(4)(5)(6)(8)33与16. 60483.804.890. 053.确定P值,作出统计推断结论:根据表8-8两两比较的P值,可认为第三组指导方式与第一组、第二组的指导方式对记忆结果影响的差异有统计学意义,参考均数差异结果,可以认为第三组指导方式优于第一组和第二组。2与1作对比组时,不拒绝H。,尚还不能认为第二组和第一组的指导方式对记忆有差别、二.LSD-t检验1.LSD-i检验统计量LSD-t检验称为最小显著差异(leastsignificantdifference)检验,适用与一对或几对在专业上有特殊意义的样本均数间的比较。它的检验统计量为t,计算公式为X-Xt=(8-12)Saae9

9 又称为 q 检验。它属多重极差检验(multiple range test),适用于多个样本均数间每两个均数之 间的全面比较。检验统计量 q 计算公式为: q = ( ) A B d X X S − (8-10) d S = 2 MS误差 A B 1 1 ( + ) n n (8-11) 通过计算得到 q 值,根据组间跨度 a 、误差自由度 v误差 和检验水准  查 q 界值表。当 q ≥ ( , ) a v q 时,拒绝无效假设,认为两组在给定的  水准下具有统计学意义。反之,不拒绝无效假设。 2. 检验步骤 例 8-3 例 8-1 资料经 F 检验推论组间差异有统计学意义,问 3 种不同的指导方式对记忆的影 响效果两两之间是否有差别? (1)建立检验假设,确立检验水准 H0:  A =  B ,即任两对比较组的总体均数相等。 H1:  A ≠  B ,即任两对比较组的总体均数不相等。  =0.05 (2)计算检验统计量 经计算得到 q 检验结果如表 8-7 所示: 表 8-7 例 8-1 三个样本均数两两比较的 q 值表 对比组 两均数之 差 q 对比组内包 含组数 q 临界值 P (8) A 与 B X X A B − (3) a 0.05 0.01 (1) (2) (4) (5) (6) 3 与 1 4.2668 6.6048 3 3.80 4.89 0.05 3. 确定 P 值,作出统计推断 结论:根据表 8-8 两两比较的 P 值,可认为第三组指导方式与第一组、第二组的指导方式对记 忆结果影响的差异有统计学意义,参考均数差异结果,可以认为第三组指导方式优于第一组和第二 组。2 与 1 作对比组时,不拒绝 H0 ,尚还不能认为第二组和第一组的指导方式对记忆有差别、 二.LSD-t 检验 1. LSD-t 检验统计量 LSD- t 检验称为最小显著差异(least significant difference )检验, 适用与一对或几对在专业上有特殊意义的样本均数间的比较。它的检验统计量为 t ,计算公式为 t = AB A B d X X S − (8-12)

JMSwa(二+二),v=V领差(8-13)Sdnng其中,X和X,为两个对比组的样本均数,n.和ng分别为对比组的样本例数。MS误差为在方差分析表中的误差均方,在完全随机设计的方差分析中为MS组内。LSD-1检验与两样本均数比较的1检验的不同主要在于合并方差和自由度的计算上。两样本均数比较的1检验中的合并方差的公式为1+S2C),V=na+ng一2。而LSD-t检验中合并方差将S用MS误差或MS组内来替代,nAnBV=V误差。t服从自由度为误差自由度的1分布,因此,可按照计算所得的t值,误差自由度以及检验水准α查t界值表,作出统计推断。2.计算检验统计量例8-4例8-1资料经F检验推论组间差异有统计学意义,问3种不同的指导方式对记忆的影响效果两两之间是否有差别?(1)建立检验假设,确立检验水准H。:μA=μB,即任两对比较组的总体均数相等。H:μA≠μg,即任两对比较组的总体均数不相等。α=0.05(2)计算检验统计量经应用SPSS软件得到两两之间差异检验结果,如表8-8所示。表8-83种不同的指导方式对记忆的影响效果两两之间差异检验结果Mean(I)指导措(J)指导措Std.Difference施施(I-J)ErrorSig.95%ConfidenceIntervalLower BoundUpperBound21.881.038-3.88-. 13-2.00 (*)3-4. 28 (*).914.000-6.23-2.3121.0382.00 (*),881.133. 883.026-2. 28 (*).9144. 23-. 31314.28 (*).914.0002. 316. 232.914.026.312.28(*)4.23The mean difference is significant at the.05 level.*3.确定P值,作出统计推断根据表8-8两两比较的结果可以看出,所有P值均小于0.05,按α=0.05水准,拒绝H。,接受H,可以认为三组指导方式对记忆的作用差异显著,第三组指导方式优于第一组和第二组,第二组指导方式优于第一组。10

10 AB d S = MS误差 A B 1 1 ( + ) n n ,v = v误差 (8-13) 其中, XA 和 XB 为两个对比组的样本均数, A n 和 B n 分别为对比组的样本例数。 MS误差 为在方 差分析表中的误差均方,在完全随机设计的方差分析中为 MS组内 。LSD-t 检验与两样本均数比较的 t 检验的不同主要在于合并方差和自由度的计算上。两样本均数比较的 t 检验中的合并方差的公式为 2 1 1 ( ) C A B S n n + , v = A n + B n -2。而 LSD- t 检验中合并方差将 2 C S 用 MS误差 或 MS组内 来替代, v = v误差 。t 服从自由度为误差自由度的 t 分布,因此,可按照计算所得的 t 值,误差自由度以及检 验水准  查 t 界值表,作出统计推断。 2. 计算检验统计量 例 8-4 例 8-1 资料经 F 检验推论组间差异有统计学意义,问 3 种不同的指导方式对记忆的影 响效果两两之间是否有差别? (1)建立检验假设,确立检验水准 H0:  A =  B ,即任两对比较组的总体均数相等。 H1:  A ≠  B ,即任两对比较组的总体均数不相等。  =0.05 (2)计算检验统计量 经应用 SPSS 软件得到两两之间差异检验结果,如表 8-8 所示。 表8-8 3种不同的指导方式对记忆的影响效果两两之间差异检验结果 (I) 指导措 施 (J) 指导措 施 Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound 1 2 -2.00(*) .881 .038 -3.88 -.13 3 -4.28(*) .914 .000 -6.23 -2.31 2 1 2.00(*) .881 .038 .13 3.88 3 -2.28(*) .914 .026 -4.23 -.31 3 1 4.28(*) .914 .000 2.31 6.23 2 2.28(*) .914 .026 .31 4.23 * The mean difference is significant at the .05 level. 3. 确定P值,作出统计推断 根据表 8-8 两两比较的结果可以看出,所有 P 值均小于 0.05,按  =0.05 水准,拒绝 H0 ,接 受 H1 ,可以认为三组指导方式对记忆的作用差异显著,第三组指导方式优于第一组和第二组,第二 组指导方式优于第一组

共11页,试读已结束,阅读完整版请下载
刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档