中国高校课件下载中心 》 教学资源 》 大学文库

《心理统计学》课程授课教案(讲稿)第十一章 秩转换的非参数检

文档信息
资源类别:文库
文档格式:DOC
文档页数:20
文件大小:1.32MB
团购合买:点击进入团购
内容简介
《心理统计学》课程授课教案(讲稿)第十一章 秩转换的非参数检
刷新页面文档预览

第十一章秩转换的非参数检验问题1.某大学进行英语教学模式探讨,将20名大学生按性别、英语初试成绩配成10对,然后随机分配每对学生到两个英语教学模式强化班进行一个月强化训练,训练后对20名大学生进行了模拟四级英语考试,要比较两种英语教学模式效果的差别,应该怎样分析呢?2.为预防大学生心理危机发生,降低自杀危险性,某课题组采用贝克抑郁自评量表(BDI-13)对当地几所高校一年级大学生进行了问卷的抽样调查。其中抑郁的程度分为无、轻、中、重四个等级。要比较不同性别发生抑郁的程度有无差别,应该如何分析?对以上问题需要通过非参数检验回答。非参数检验(nonparametric test)是相对于参数检验(parametrictest)而言的。参数检验是假定随机样本来自某种已知分布(如正态分布)的总体,并对总体分布的参数(如总体均数)进行估计或检验。t检验和方差分析属参数统计方法。非参数检验又称任意分布检验(distribution-freetest),该类方法的统计推断基础是比较分布而不是比较参数,对总体分布不作严格定义,不依赖于总体分布类型,也不对总体参数进行统计推断。非参数统计方法应用十分广泛,可以解决①总体分布不确定。②不能或未加精确测量资料,如等级资料。③一端或两端无确定数值的资料。④分布呈非正态而又无适当的数据转换方法等假设检验问题。非参数统计方法很多,本章主要介绍秩转换的非参数检验。秩转换的非参数检验是先将数值变量从小到大转换成秩,或先将等级从弱到强转换成秩,然后计算检验统计量,其假设检验的结果只对总体分布的位置差别敏感,对总体分布的形状差别不敏感。对于符合参数检验的资料如果用非参数检验方法,由于没有充分利用资料提供的信息,往往导致其检验效率会低手参数检验,犯Ⅱ型错误的概率增大。因此,在实际工作中对符合参数检验或经变量变换后符合参数检验的资料应首选参数检验。本章学习目标1.理解参数与非参数检验法的含义与特点2.熟练掌握熟悉不同设计类型的秩和检验方法3.初步掌握SPSS中秩和检验的操作1

1 第十一章 秩转换的非参数检验 问题 1.某大学进行英语教学模式探讨,将 20 名大学生按性别、英语初试成绩配成 10 对, 然后随机分配每对学生到两个英语教学模式强化班进行一个月强化训练,训练后对 20 名大 学生进行了模拟四级英语考试,要比较两种英语教学模式效果的差别,应该怎样分析呢? 2.为预防大学生心理危机发生,降低自杀危险性,某课题组采用贝克抑郁自评量表 (BDI-13)对当地几所高校一年级大学生进行了问卷的抽样调查。其中抑郁的程度分为无、 轻、中、重四个等级。要比较不同性别发生抑郁的程度有无差别,应该如何分析? 对以上问题需要通过非参数检验回答。非参数检验(nonparametric test)是相对于参数 检验(parametric test)而言的。 参数检验是假定随机样本来自某种已知分布(如正态分布)的总体,并对总体分布的参 数(如总体均数)进行估计或检验。 t 检验和方差分析属参数统计方法。 非参数检验又称任意分布检验(distribution-free test),该类方法的统计推断基础是比较 分布而不是比较参数,对总体分布不作严格定义,不依赖于总体分布类型,也不对总体参数 进行统计推断。非参数统计方法应用十分广泛,可以解决①总体分布不确定。②不能或未加 精确测量资料,如等级资料。③一端或两端无确定数值的资料。④分布呈非正态而又无适当 的数据转换方法等假设检验问题。 非参数统计方法很多,本章主要介绍秩转换的非参数检验。秩转换的非参数检验是先将 数值变量从小到大转换成秩,或先将等级从弱到强转换成秩,然后计算检验统计量,其假设 检验的结果只对总体分布的位置差别敏感,对总体分布的形状差别不敏感。 对于符合参数检验的资料如果用非参数检验方法,由于没有充分利用资料提供的信息, 往往导致其检验效率会低于参数检验,犯Ⅱ型错误的概率增大。因此,在实际工作中对符合 参数检验或经变量变换后符合参数检验的资料应首选参数检验。 本章学习目标 1. 理解参数与非参数检验法的含义与特点 2. 熟练掌握熟悉不同设计类型的秩和检验方法 3. 初步掌握 SPSS 中秩和检验的操作

第一节Wilcoxon符号秩检验Wilcoxon符号秩和检验(Wilcoxonsignedranktest)又称Wilcoxon配对法,Wilcoxon(1945年)提出这个方法,其研究目的是推断配对资料的差值是否来自中位数为零的总体也用于推断总体中位数是否等于指定值。Wilcoxon符号秩和检验的基本思想是:假定两种处理效应相同(或某种处理无作用),则差值的总体分布是对称的,总体中位数为0(H。);在H。所规定的总体中抽样,当观察例数比较多时,正、负秩和应大致相等,差别只是一些随机因素造成的。即如果H。成立,从差值的随机样本中获得正、负秩和相差悬殊的可能性很小。如果样本的正秩和与负秩和差别很大,根据小概率事件在一次抽样中不可能发生的推断理论,我们有理由拒绝H。,接受H,,即认为两种处理效应不同(或某种处理有作用);反之,不拒绝H。,不能认为两种处理效应不同(或某种处理有作用)。一、配对设计资料的分析Wilcoxon符号秩检验用于配对设计样本差值的中位数和0的比较,目的是推断配对样本差值的总体中位数是否和0有差别,即推断配对资料的两个相关样本所来自的两个总体中位数是否有差别。例11-1某大学进行英语教学模式探讨,将20名大学生按性别、英语初试成绩配成10对,然后随机分配每对学生到两个英语教学模式强化班进行强化训练,训练一个月后这10对大学生的模拟四级英语考试成绩如下所示。请问参加不同英语教学模式强化班的效果有无差别?编号123345678910强化1班706268688184648798637强化2班80867773918172897279本例为小样本资料,对两个英语教学模式强化班模拟四级英语考试成绩的差值作正态性检验,得0.05<P<0.10,按α=0.10水准拒绝H。,接受H,,即资料不符合正态分布,不满足配对t检验的条件,作为非正态分布资料,现用Wilcoxon符号秩检验。1.建立检验假设,确定检验水准H。:差值的总体中位数M。=0H:Ma+0α=0.052.计算检验统计量(1)编秩刨除差值为0的对子后,余下的为有效对子数n,见表11-1第(4)栏,有效对子数n=9:按9个差值的绝对值从小到大编秩,遇差值的绝对值相等时需要取平均秩,称为相同秩,表11-1第(4)栏差值的绝对值有2个为3,其秩依次应为1,2,取平均秩各为1.5,秩的正负符号与差值相同,见表11-1第(5)栏。2

2 第一节 Wilcoxon 符号秩检验 Wilcoxon 符号秩和检验(Wilcoxon signed rank test)又称 Wilcoxon 配对法,Wilcoxon (1945 年)提出这个方法,其研究目的是推断配对资料的差值是否来自中位数为零的总体, 也用于推断总体中位数是否等于指定值。 Wilcoxon 符号秩和检验的基本思想是:假定两种处理效应相同(或某种处理无作用), 则差值的总体分布是对称的,总体中位数为 0( H0 );在 H0 所规定的总体中抽样,当观察 例数比较多时,正、负秩和应大致相等,差别只是一些随机因素造成的。即如果 H0 成立, 从差值的随机样本中获得正、负秩和相差悬殊的可能性很小。如果样本的正秩和与负秩和差 别很大,根据小概率事件在一次抽样中不可能发生的推断理论,我们有理由拒绝 H0 ,接受 H1 ,即认为两种处理效应不同(或某种处理有作用);反之,不拒绝 H0 ,不能认为两种处 理效应不同(或某种处理有作用)。 一、配对设计资料的分析 Wilcoxon 符号秩检验用于配对设计样本差值的中位数和 0 的比较,目的是推断配对样本 差值的总体中位数是否和 0 有差别,即推断配对资料的两个相关样本所来自的两个总体中位 数是否有差别。 例 11-1 某大学进行英语教学模式探讨,将 20 名大学生按性别、英语初试成绩配成 10 对,然后随机分配每对学生到两个英语教学模式强化班进行强化训练,训练一个月后这 10 对大学生的模拟四级英语考试成绩如下所示。请问参加不同英语教学模式强化班的效果有无 差别? 编号 1 2 3 4 5 6 7 8 9 10 强化 1 班 70 62 68 68 81 84 64 86 37 79 强化 2 班 80 86 77 73 91 81 72 89 72 79 本例为小样本资料,对两个英语教学模式强化班模拟四级英语考试成绩的差值作正态性 检验,得 0.05 0.10   P ,按  = 0.10 水准拒绝 H0 ,接受 H1 ,即资料不符合正态分布, 不满足配对 t 检验的条件,作为非正态分布资料,现用 Wilcoxon 符号秩检验。 1.建立检验假设,确定检验水准 H0 :差值的总体中位数 Md = 0 H1: Md  0  = 0.05 2.计算检验统计量 (1)编秩 刨除差值为 0 的对子后,余下的为有效对子数 n ,见表 11-1 第(4)栏,有效对子数 n = 9 ; 按 9 个差值的绝对值从小到大编秩,遇差值的绝对值相等时需要取平均秩,称为相同秩, 表 11-1 第(4)栏差值的绝对值有 2 个为 3,其秩依次应为 1,2,取平均秩各为 1.5,秩的正负 符号与差值相同,见表 11-1 第(5)栏

表11-1不同英语教学模式强化班的模拟四级英语考试成绩比较配对号强化1班强化2班差值d秩次(2)(1)(3)(5)(4)=(3)-(2)17079-10-6262 86-24-8368-977-546873-5-358191-10-76848131.576472-8-488689-3-1.592772-35-91079790T =1.5 T. = 43.5(2)求秩和并确定统计量T值正、负差值秩次之和分别以T、T表示,T及T之和等于n(n+1)/2,即1+2+3++n之和,此式可验算T和T的计算是否正确。对例11-1计算得T=1.5,T=43.5,其和为45,n(n+1)/2=9(9+1)/2=45,可见于T,T计算无误。双侧检验时,取绝对值较小的秩和为统计量T,本例取T=1.5。3.确定P值并推断结论A:查表法当n≤50时,查T界值表。查表时,先找到横标目n,将检验统计量T值与此行上的界值范围自左向右逐一相比,若T值在上、下界值范围外,其P值小于表纵标目所示相应概率水平;若T值恰好等于界值,其P值是近似等于相应概率水平(一般很少遇到);若T值在上、下界值范围内,其P值大于相应概率水平。本例n=9,T=1.5,查T界值表,得双侧0.0150,超出T界值表的范围,可利用秩和T分布的正态近似法作Z检验,此时T的均数与标准误分别为μ=n(n+1)/4(11-1)0r= /n(n+1)(2n+1)/24(11-2)T分布近似正态分布,有公式(11-3)计算Z值3

3 表11-1 不同英语教学模式强化班的模拟四级英语考试成绩比较 配对号 强化1班 强化2班 差值 d 秩次 (1) (2) (3) (4)=(3)-(2) (5) 1 70 79 -10 -6 2 62 86 -24 -8 3 68 77 -9 -5 4 68 73 -5 -3 5 81 91 -10 -7 6 84 81 3 1.5 7 64 72 -8 -4 8 86 89 -3 -1.5 9 27 72 -35 -9 10 79 79 0 T 1.5 + = T 43.5 − = (2)求秩和并确定统计量 T 值 正、负差值秩次之和分别以 T+ 、T− 表示,T+ 及 T− 之和等于 n n( 1) / 2 + ,即 1 2 3 + + + . +n 之和,此式可验算 T+ 和 T− 的计算是否正确。对例 11-1 计算得 T 1.5 + = ,T 43.5 − = ,其 和为 45, n n( 1) / 2 9(9 1) / 2 45 + = + = ,可见于 T+ ,T− 计算无误。 双侧检验时,取绝对值较小的秩和为统计量 T ,本例取 T =1.5 。 3.确定 P 值并推断结论 A:查表法 当 n  50 时,查 T 界值表。查表时,先找到横标目 n ,将检验统计量 T 值与此行上的 界值范围自左向右逐一相比,若 T 值在上、下界值范围外,其 P 值小于表纵标目所示相应 概率水平;若 T 值恰好等于界值,其 P 值是近似等于相应概率水平(一般很少遇到);若 T 值在上、下界值范围内,其 P 值大于相应概率水平。本例 n = 9 ,T =1.5 ,查 T 界值表, 得双侧 0.01 0.02   P ,按  = 0.05 水准拒绝 H0 ,接受 H1 ,可认为两不同英语教学模式 强化班的效果有差别,即强化 2 班英语教学模式好。 注意:如果较小样本出现相同秩较多时,检验结果会存在偏性。因此,应尽量提高测量 精度,以避免出现较多的相同秩。 B:正态近似法 若 n  50 ,超出 T 界值表的范围,可利用秩和 T 分布的正态近似法作 Z 检验,此时 T 的均数与标准误分别为 T = n(n +1)/ 4 (11-1)  T = n(n +1)(2n +1)/ 24 (11-2) T 分布近似正态分布,有公式(11-3)计算 Z 值

Z = - 4μ/-0.5_ I_ - n( +1)/4 - 0.5(11-3)dTVn(n+1)(2n+1)/24式中0.5是连续性校正值,当n足够时可省略这种连续性校正。若相同秩次的个数较多(超过25%)时,用式(11-3)求得的Z值偏小,应按公式(11-4)计算较正的Zc。T-n(n+1)/4-0.5(11-4)Z=n(n+1)(2n+1)_Z(tj-t)V 2448式中t,为第j个(-1,2)含相同秩次的个数。假定某资料中第一次相同秩有2个1.5,第二次相同秩有3个8.5,第三次相同秩有5个25,则t,=2,t2=3,1=5,Z(t -t)=(23 -2)+(33 -3)+(53 -5)=150 。符号秩检验若用于配对的等级资料,则先把等级从弱到强转换成秩(1,2,3,…);然后求各对秩的差值,省略所有差值为0的对子数,令余下的有效对子数为n;最后按n个差值编正秩与负秩,分别计算正秩和与负秩和。对于等级资料,因相同秩多,最好用大样本。二、样本中位数与总体中位数比较一组随机样本来自正态总体,其目的是比较该总体均数与某常数是否不同时,可用1检验;如果是总体分布非正态或未知的一组样本资料,要比较该总体中位数与某数值是否不同,可选用Wilcoxon符号秩和检验。例11-2某课题组为探讨即将毕业的男大学生抑郁水平是否高于在校男生,随机抽取某医学高校五年级男生25名,作贝克抑郁自评量表(BDI-13)的问卷调查。贝克抑郁总分为:0、3、5、16、25、2、0、4、0、4、9、2、2、1、14、12、13、9、5、8、0、7、6、1、6,已知一般高校在校男生贝克总分的总体中位数为3。试比较医学高校即将毕业的男大学生贝克抑郁总分的水平与一般在校男生是否相同?用一样本中位数和总体中位数比较,目的是推断样本所来自的总体中位数M和某个已知的总体中位数M。是否有差别。即用样本各变量值和M。的差值,推断差值的总体中位数与0是否有差别。其检验原理与配对设计资料类似,所不同的只是差值为各观察值与已知总体中位数之差:d=X-M。,其他符号的意义同配对设计资料。计算样本资料25例贝克抑郁总分与已知总体贝克抑郁总分中位数M。=3的差值并进行正态性检验,得W=0.8678,P=0.0039,按α=0.10水准拒绝H。,差值不符合正态分布,即例11-2资料不满足t检验关于样本来自正态分布总体的条件,宜用Wilcoxon符号秩检验。4

4 ( 1)(2 1)/ 24 0.5 ( 1)/ 4 0.5 + + − + − = − − = n n n T T n n Z T T   (11-3) 式中 0.5 是连续性校正值,当 n 足够时可省略这种连续性校正。 若相同秩次的个数较多(超过 25%)时,用式(11-3)求得的 Z 值偏小,应按公式(11-4) 计算较正的 Zc。 48 ( ) 24 ( 1)(2 1) ( 1)/ 4 0.5 3  − − + + − + − = j j c n n n t t T n n Z (11-4) 式中 j t 为第 j 个(j=1,2,.)含相同秩次的个数。假定某资料中第一次相同秩有 2 个 1.5, 第二次相同秩有 3 个 8.5,第三次相同秩有 5 个 25,则 t 1 = 2, 2 t = 3, 3 t = 5 , 3 3 3 3 ( ) (2 2) (3 3) (5 5) 150 j j  t t − = − + − + − = 。 符号秩检验若用于配对的等级资料,则先把等级从弱到强转换成秩(1,2,3,.);然后求 各对秩的差值,省略所有差值为 0 的对子数,令余下的有效对子数为 n ;最后按 n 个差值编 正秩与负秩,分别计算正秩和与负秩和。对于等级资料,因相同秩多,最好用大样本。 二、样本中位数与总体中位数比较 一组随机样本来自正态总体,其目的是比较该总体均数与某常数是否不同时,可用 t 检验; 如果是总体分布非正态或未知的一组样本资料,要比较该总体中位数与某数值是否不同,可 选用 Wilcoxon 符号秩和检验。 例 11-2 某课题组为探讨即将毕业的男大学生抑郁水平是否高于在校男生,随机抽取 某医学高校五年级男生 25 名,作贝克抑郁自评量表(BDI-13)的问卷调查。贝克抑郁总分 为:0、3、5、16、25、2、0、4、0、4、9、2、2、1、14、12、13、9、5、8、0、7、6、1、 6,已知一般高校在校男生贝克总分的总体中位数为 3。试比较医学高校即将毕业的男大学 生贝克抑郁总分的水平与一般在校男生是否相同? 用一样本中位数和总体中位数比较,目的是推断样本所来自的总体中位数 M 和某个已 知的总体中位数 M0 是否有差别。即用样本各变量值和 M0 的差值,推断差值的总体中位数 与 0 是否有差别。其检验原理与配对设计资料类似,所不同的只是差值为各观察值与已知 总体中位数之差: i 0 d X M = − ,其他符号的意义同配对设计资料。 计算样本资料 25 例贝克抑郁总分与已知总体贝克抑郁总分中位数 0 M = 3 的差值并进行 正态性检验,得 W P = = 0.8678, 0.0039,按  = 0.10 水准拒绝 H0 ,差值不符合正态分布, 即例 11-2 资料不满足 t 检验关于样本来自正态分布总体的条件,宜用 Wilcoxon 符号秩检验

表11-225名高校将毕业的男大学生抑郁贝克总分与3比较样本号贝克总分d=(2)-3秩次(1)(2)(3)(4) 10-3-12.523043527.5416132352522 24 62-1-370-3-12.5841390-3-12.510413119618.5122-1-3213-1-3141-2-7.511141122916122017131021189618.519527.5852017210-3-12.5227416236312.51-224-7.5256312.5T = 226T = 74计算样本资料25例贝克抑郁总分与已知总体贝克抑郁总分中位数M。=3的差值并进行正态性检验,得W=0.8678,P=0.0039,按α=0.10水准拒绝H。,差值不符合正态分布,即例11-2资料不满足t检验关于样本来自正态分布总体的条件,宜用Wilcoxon符号秩检验。对例11-2资料的检验步骤1.建立检验假设,确定检验水准H。:医学高校即将毕业的男生贝克抑郁总分水平与一般在校男生相同,即M。=0H,:医学高校即将毕业的男生贝克抑郁总分水平与一般在校男生不同,即M。+0α=0.055

5 表11-2 25名高校将毕业的男大学生抑郁贝克总分与3比较 样本号 贝克总分 d= (2)-3 秩次 (1) (2) (3) (4) 1 0 -3 -12.5 2 3 0 — 3 5 2 7.5 4 16 13 23 5 25 22 24 6 2 -1 -3 7 0 -3 -12.5 8 4 1 3 9 0 -3 -12.5 10 4 1 3 11 9 6 18.5 12 2 -1 -3 13 2 -1 -3 14 1 -2 -7.5 11 14 11 22 16 12 9 20 17 13 10 21 18 9 6 18.5 19 5 2 7.5 20 8 5 17 21 0 -3 -12.5 22 7 4 16 23 6 3 12.5 24 1 -2 -7.5 25 6 3 12.5 T 226 + = T 74 − = 计算样本资料 25 例贝克抑郁总分与已知总体贝克抑郁总分中位数 0 M = 3 的差值并进行 正态性检验,得 W P = = 0.8678, 0.0039,按  = 0.10 水准拒绝 H0 ,差值不符合正态分布, 即例 11-2 资料不满足 t 检验关于样本来自正态分布总体的条件,宜用 Wilcoxon 符号秩检验。 对例 11-2 资料的检验步骤 1.建立检验假设,确定检验水准 H0:医学高校即将毕业的男生贝克抑郁总分水平与一般在校男生相同,即 Md = 0 H1:医学高校即将毕业的男生贝克抑郁总分水平与一般在校男生不同,即 0 Md   = 0.05

2.计算检验统计量(1)求差值:d=x-M。,见表11-2第(3)栏。(2)编秩除去差值为0的2号样,余下的为有效对子数n=24:按差值的绝对值从小到大编秩,表11-2第(4)栏差值的绝对值有5个1、4个2、6个3、2个6,需要取平均秩,平均秩依次为(1+5)/2=3、(6+9)/2=7.5、(10+15)/2=12.5、(18+19)/2=18.5,秩的正负符号与差值相同。(3)求秩和并确定统计量T值分别求出正、负差值秩次之和,即T=226、T_=74。单侧检验与双侧时不同,可任取正秩和或负秩和为统计量T,本例取T_=74。3.确定P值并推断结论A:查表法本例n=24,T=74,查配对设计用T界值表,得双侧0.02<P<0.05,按α=0.05检验水准,拒绝H。,接受H,。可认为该医学高校即将毕业的男大学生贝克抑郁总分水平高于一般在校男生。B:正态近似法本例相同秩次的个数较多,应按公式(11-4)计算较正的Z.值(省略连续性校正0.5)=5,=4,1,=6,t,=2Z(t, -t,)= (53 -5)+(43 -4)+(63 -6) +(23 -2) = 396[T - n(n+1) / 4|74-24(24+1)/4= 2.179Z.=-n(n+1)(2n+1)_(-t)24(24+1)(2×24+1)_396V244824824查1界值表,V=o0得双侧0.02<P<0.05,结论与查表法完全相同。第二节两个独立样本比较的Wilcoxon秩和检验Wilcoxon秩和检验(Wilcoxonranksumtest),用于推断计量资料或等级资料的两个独立样本所来自的两个总体分布是否有差别。Wilcoxon秩和检验的基本思想是:假设两总体分布相同(H。),那么可认为两样本是从同一总体中抽取的随机样本,将两样本数据混合后由小到大编制,然后分别计算两样本的秩和T,与T,(n,=n,时,T、T,应大致相等),进而计算两样本的平均秩T、T,(n,±nz时,T、T,应与样本含量ni、nz成比例),其两样本的平均秩T、T应大致相等,差别是由于随机抽样引起;既从相同总体中随机抽样,获得的秩和T与T,分别与n,和n,不成比例的可能性非常小,根据数理统计推断原理,可以认为在一次抽样中,这样的小概率事件不能6

6 2.计算检验统计量 (1)求差值: i 0 d x M = − ,见表 11-2 第(3)栏。 (2)编秩 除去差值为 0 的 2 号样,余下的为有效对子数 n = 24 ;按差值的绝对值从小到大编秩, 表 11-2 第(4)栏差值的绝对值有 5 个 1、4 个 2、6 个 3、2 个 6,需要取平均秩,平均秩依 次为 (1 5) / 2 3 + = 、(6 9) / 2 7.5 + = 、(10 15) / 2 12.5 + = 、(18 19) / 2 18.5 + = ,秩的正负 符号与差值相同。 (3)求秩和并确定统计量 T 值 分别求出正、负差值秩次之和,即 T 226 + = 、 T 74 − = 。 单侧检验与双侧时不同,可任取正秩和或负秩和为统计量 T ,本例取 T 74 − = 。 3.确定 P 值并推断结论 A:查表法 本例 n = 24,T = 74 ,查配对设计用 T 界值表,得双侧 0.02 0.05   P ,按  = 0.05 检 验水准,拒绝 H0 ,接受 H1 。可认为该医学高校即将毕业的男大学生贝克抑郁总分水平高于 一般在校男生。 B:正态近似法 本例相同秩次的个数较多,应按公式(11-4)计算较正的 Zc值(省略连续性校正 0.5) 1 t = 5, 2 t = 4 , 3 t = 6, 4 t = 2 3 3 3 3 3 ( ) (5 5) (4 4) (6 6) (2 2) 396 j j  t t − = − + − + − + − = 3 ( 1) / 4 74 24(24 1) / 4 2.179 ( 1)(2 1) ( ) 24(24 1)(2 24 1) 396 24 48 24 48 c j j T n n Z n n n t t − + − + = = = + + − +  + −  − 查 t 界值表, = 得双侧 0.02 0.05   P ,结论与查表法完全相同。 第二节 两个独立样本比较的 Wilcoxon 秩和检验 Wilcoxon 秩和检验(Wilcoxon rank sum test),用于推断计量资料或等级资料的两个独 立样本所来自的两个总体分布是否有差别。 Wilcoxon 秩和检验的基本思想是:假设两总体分布相同( H0 ),那么可认为两样本是 从同一总体中抽取的随机样本,将两样本数据混合后由小到大编制,然后分别计算两样本的 秩和 T1 与 T2 ( n1 = n2 时, T1、T2 应大致相等),进而计算两样本的平均秩 T1 、T2 ( n1  n2 时, T1、T2 应与样本含量 1 n 、 n2 成比例),其两样本的平均秩 T1 、T2 应大致相等,差别是 由于随机抽样引起;既从相同总体中随机抽样,获得的秩和 T1 与 T2 分别与 1 n 和 n2 不成比例 的可能性非常小,根据数理统计推断原理,可以认为在一次抽样中,这样的小概率事件不能

发生。如果按上述方法计算的两样本平均秩T和差别很大,我们就有理由认为H。不成立。一、定量数据的两小样本比较例11-3某高校医学心理研究者对入学新生进行了心理健康状况普查,认为有焦虑倾向者应该比无焦虑倾向的正常学生完成词汇决策任务的时间更短。为了验证自己的想法,他从被试学生中,随机抽取有焦虑倾向和无焦虑倾向大学生各10名做一个特定的实验,其结果如下:788385919598101180有焦虑倾向者:65759499100102104105106108110118无焦虑倾向者:请问这些数据能否支持研究者的想法?(α=0.05)焦虑倾向者中有一极端值180,没有充分的理由将其从分析中剔出,则焦虑组数据不满足正态性(P<0.0012),且推断两总体方差不等(P<0.0001),故两组比较采用Wi1coxon秩和检验。表 11-3两组大学生完成任务的时间(分)有焦虑倾向组无焦虑倾向组秩次秩次完成任务时间完成任务时间651957.5752991078311100834131025851041469110511957.5106169981081712181011102018011819ni=10Ti=69.5n2=10T2=140.51.建立检验假设,确定检验水准H。:两总体分布相同,有无焦虑倾向的大学生完成任务时间的总体分布相同H:两总体分布不同,有无焦虑倾向的大学生完成任务时间的总体分布不同α=0.052.计算检验统计量(1)编秩将两组数据由小到大统一编秩(为便于编秩可先将两组数据分别由小到大排序)。编秩时遇有相同数据时取平均秩次,本例两个对比组均有数据95,应编秩次为7、8,则各取平均秩次(7+8)/2=7.5(表11-3)。(2)求秩和并确定统计量T两组秩次分别相加,其对应的秩和分别为69.5和140.5。若两组例数相等,则在取一组的秩和为统计量。若两组例数不等,则以样本例数较小者对应的秩和为统计量。本例n=n,=10,可任取T、T,为统计量,现取T,为检验统计量T,7

7 发生。如果按上述方法计算的两样本平均秩 T1 和 T2 差别很大,我们就有理由认为 H0 不成立。 一、定量数据的两小样本比较 例 11-3 某高校医学心理研究者对入学新生进行了心理健康状况普查,认为有焦虑倾向 者应该比无焦虑倾向的正常学生完成词汇决策任务的时间更短。为了验证自己的想法,他从 被试学生中,随机抽取有焦虑倾向和无焦虑倾向大学生各 10 名做一个特定的实验,其结果 如下: 有焦虑倾向者: 65 75 78 83 85 91 95 98 101 180 无焦虑倾向者: 94 99 100 102 104 105 106 108 110 118 请问这些数据能否支持研究者的想法?(  = 0.05 ) 焦虑倾向者中有一极端值 180,没有充分的理由将其从分析中剔出,则焦虑组数据不满足 正态性( P  0.0012 ),且推断两总体方差不等( P  0.0001 ),故两组比较采用 Wilcoxon 秩和检验。 表 11-3 两组大学生完成任务的时间(分) 有焦虑倾向组 无焦虑倾向组 完成任务时间 秩次 完成任务时间 秩次 65 1 95 7.5 75 2 99 10 78 3 100 11 83 4 102 13 85 5 104 14 91 6 105 11 95 7.5 106 16 98 9 108 17 101 12 110 18 180 20 118 19 n1=10 T1=69.5 n2=10 T2=140.5 1.建立检验假设,确定检验水准 H0 :两总体分布相同,有无焦虑倾向的大学生完成任务时间的总体分布相同 H1:两总体分布不同,有无焦虑倾向的大学生完成任务时间的总体分布不同  = 0.05 2.计算检验统计量 (1)编秩 将两组数据由小到大统一编秩(为便于编秩可先将两组数据分别由小到大排序)。编秩时 遇有相同数据时取平均秩次,本例两个对比组均有数据 95,应编秩次为 7、8,则各取平均秩 次(7+8)/2=7.5(表 11-3)。 (2)求秩和并确定统计量 T 两组秩次分别相加,其对应的秩和分别为 69.5 和 140.5。 若两组例数相等,则任取一组的秩和为统计量。若两组例数不等,则以样本例数较小者 对应的秩和为统计量。本例 1 2 n n = =10 ,可任取 T1、T2 为统计量,现取 T1 为检验统计量 T

即T=69.5。3.确定P值并推断结论A:查表法当n,≤10和n,-n≤10时,查两样本比较用T界值表。查表时,先找横标目n,再从表上方找纵标目两组例数的差nz-n,两者相交处对应4行界值范围,逐行将检验统计量T值与界值范围相比,若T值在界值范围外,其P值小于相应概率水平:若T值在界值范围内,其P值大于相应概率水平;T值恰好等于界值的情况很少,其P值等于(一般是近似等于)相应概率水平。本例n=10,两组例数的差n2-n=0,T=69.5,0.01双侧概率对应的T界值为71~139,T=69.5在该范围之外,故P10或n2-n>10,超T界值表的范围,可用正态近似检验。令N=n+n,按下式计算Z值。Z= -n(N+1)/2-0.5(11-5)/nn,(N+1)/12式中,0.5为连续性校正数。因为T分布是不连续的,而Z分布是连续的,当样本量较大时,这种校正一般影响甚微,常可略去。式(11-5)用于无相同秩次,或相同秩次不多时:若相同秩次较多(比如超过25%)时,应按下式进行校正。Zc=z/Vc , C=1-Z(t -t)/(N3-M)(11-6)其中,C为校正数,t,为第j个相同秩次的个数。例11-3按公式(11-5)计算,Z=2.646。查1界值表,V=00,得双侧0.005<P<0.01,结论与查T界值表法相同。二、等级资料的两样本比较例11-4为预防大学生心理危机发生,降低自杀危险性,某课题组采用贝克抑郁自评量表(BDI-13)对当地几所高校一年级大学生进行了问卷的抽样调查。回收有效问卷718份,问卷结果见表11-4第(1)至(3)栏。试比较不同性别发生抑郁的程度有无差别?表11-4某地高校一年级男女大学生贝克抑郁自评量表检查结果结果人数合计秩次范围平均秩次秩和男生女生男生女生(1)(2)(3)(4)(5)(6)(7)=(2)(6)(8)=(3)(6)无231230461231.053130.0146153361.0轻5377130462591526.527904.540540.5中4966111649.031801.042834.0592—706重5712707—718712.53562.54987.5合计718n=338n2=380/一Tr=116629.0T2=141492.08

8 即 T = 69.5。 3.确定 P 值并推断结论 A:查表法 当 1 n 10 和 2 1 n n − 10 时,查两样本比较用 T 界值表。查表时,先找横标 目 1 n ,再从表上方找纵标目两组例数的差 n n 2 1 − ,两者相交处对应 4 行界值范围,逐行将 检验统计量 T 值与界值范围相比,若 T 值在界值范围外,其 P 值小于相应概率水平;若 T 值 在界值范围内,其 P 值大于相应概率水平; T 值恰好等于界值的情况很少,其 P 值等于(一 般是近似等于)相应概率水平。本例 1 n =10 ,两组例数的差 2 1 n n − = 0,T = 69.5 ,0.01 双侧概率对应的 T 界值为 71~139,T = 69.5 在该范围之外,故 P  0.01 。按  = 0.05 检 验水准,拒绝 H0 ,接受 H1 ,可认为大学生有焦虑倾向者比无焦虑倾向的正常学生完成词 汇决策任务的时间更短。研究者的想法得到验证。 B:正态近似法 如果 n1 10 或 n n 2 1 − 10,超 T 界值表的范围,可用正态近似检验。 令 N = n1 + n2 ,按下式计算 Z 值。 1 1 2 ( 1) 2 0.5 ( 1) 12 T n N Z n n N − + − = + (11-5) 式中,0.5 为连续性校正数。因为 T 分布是不连续的,而 Z 分布是连续的,当样本量较 大时,这种校正一般影响甚微,常可略去。 式(11-5)用于无相同秩次,或相同秩次不多时;若相同秩次较多(比如超过 25%)时, 应按下式进行校正。 Z Z C C = , 3 3 1 ( ) ( ) C t t N N = − − −  j j (11-6) 其中, C 为校正数 , j t 为第 j 个相同秩次的个数。 例 11-3 按公式(11-5)计算, Z = 2.646。 查 t 界值表,  =,得双侧 0.005 0.01   P ,结论与查 T 界值表法相同。 二、等级资料的两样本比较 例 11-4 为预防大学生心理危机发生,降低自杀危险性,某课题组采用贝克抑郁自评 量表(BDI-13)对当地几所高校一年级大学生进行了问卷的抽样调查。回收有效问卷 718 份,问卷结果见表 11-4 第(1)至(3)栏。试比较不同性别发生抑郁的程度有无差别? 表 11-4 某地高校一年级男女大学生贝克抑郁自评量表检查结果 结果 (1) 人数 合计 (4) 秩次范围 (5) 平均秩次 (6) 秩和 男生 (2) 女生 (3) 男生 (7)=(2)(6) 女生 (8)=(3)(6) 无 231 230 461 1—461 231.0 53361.0 53130.0 轻 53 77 130 462—591 526.5 27904.5 40540.5 中 49 66 111 592—706 649.0 31801.0 42834.0 重 5 7 12 707—718 712.5 3562.5 4987.5 合计 n1=338 n2=380 718 — — T1=116629.0 T2=141492.0

1.建立检验假设,确定检验水准H。:高校一年级男女大学生发生抑郁程度的总体分布相同H,:高校一年级男女大学生发生抑郁程度的总体分布不同α=0.052.计算检验统计量(1)编秩本例为等级资料,先计算各等级的合计人数,见第(4)栏,再依据抑郁检验结果从“无”至“重”等级确定秩次范围并计算平均秩次。如抑郁检验结果为“无”者共461例,其秩次范围1一461,平均秩次为(1+461)/2=231.0,结果为“轻”者共130例,其秩次范围462一591,平均秩次为(462+591)/2=526.5,仿此得第(5)(6)栏。(2)求秩和先将各等级例数乘以平均秩次,求出秩和TI与T2,见(7)、(8)栏。(3)确定检验统计量男生人数(n=338)少于女生(n=380),检验统计量T=T=116629.0。由于n=338,需用Z检验。又由于每个等级的人数表示相同秩次的个数t,,相同秩次过多,需要对Z进行校正,故先按式(11-5)计算Z值,再按式(11-6)计算,Zc=2.066。3.确定P值并推断结论查t界值表,V=o0得双侧0.02<P<0.05,SPSS软件给出Z=2.066,P=0.039。按α一0.05水准拒绝H。,接受H,故可以认为高校一年级男女大学生发生抑郁的程度不同,女生高于男生。三、两样本比较的Mann-WhitneyU检验两独立样本比较还常用Mann-WhitneyU检验(Mann-WhitneyUtest)。Wilcoxon(1945年)提出秩和检验后,Mann和Whitney对这个方法的发展都做出了贡献。U检验亦称M-W检验。Mann-WhitneyU检验的基本思想是:假设两总体分布相同(H。),那么可认为两样本n和n,是从同一总体中抽取的随机样本,将两样本数据混合后由小到大排列,然后把第一个样本的n(n≤n)个变量值的每个变量值,与第二个样本的n个变量值逐个比较,小于记0,相等记0.5,(大于记1),检验统计量U值是对n,逐个比较记分求和。本方法规定样本为n<n,当n=n,时,是以平均秩较小(T<T,)的样本为n,并检验统计量加上0.5。当样本n,的每个变量值都大于样本n,的所有变量值时,U=n,n;当样本n的每个变量值都9

9 1.建立检验假设,确定检验水准 H0 :高校一年级男女大学生发生抑郁程度的总体分布相同 H1:高校一年级男女大学生发生抑郁程度的总体分布不同 =0.05 2.计算检验统计量 (1)编秩 本例为等级资料,先计算各等级的合计人数,见第(4)栏,再依据抑郁检验结果从“无” 至“重”等级确定秩次范围并计算平均秩次。如抑郁检验结果为“无”者共 461 例,其秩次 范围 1—461,平均秩次为 (1 461) / 2 231.0 + = ,结果为“轻”者共 130 例,其秩次范围 462 —591,平均秩次为 (462 591) / 2 526.5 + = ,仿此得第(5) (6)栏。 (2)求秩和 先将各等级例数乘以平均秩次,求出秩和 T1 与 T2,见(7)、(8)栏。 (3)确定检验统计量 男生人数( 1 n = 338 )少于女生( 2 n = 380 ),检验统计量 1 T T= =116629.0 。由于 1 n = 338 ,需用 Z 检验。又由于每个等级的人数表示相同秩次的个数 j t ,相同秩次过多, 需要对 Z 进行校正,故先按式(11-5)计算 Z 值,再按式(11-6)计算, 2.066 ZC = 。 3.确定 P 值并推断结论 查 t 界值表, = 得双侧 0.02 0.05   P ,SPSS 软件给出 Z = 2.066,P = 0.039 。 按 =0.05 水准拒绝 H0 ,接受 H1 ,故可以认为高校一年级男女大学生发生抑郁的程度 不同,女生高于男生。 三、两样本比较的 Mann-Whitney U 检验 两独立样本比较还常用 Mann-Whitney U 检验(Mann-Whitney U test)。Wilcoxon (1945 年)提出秩和检验后,Mann 和 Whitney 对这个方法的发展都做出了贡献。 U 检验亦 称 M-W 检验。 Mann-Whitney U 检验的基本思想是:假设两总体分布相同( H0 ),那么可认为两样本 1 n 和 n2 是从同一总体中抽取的随机样本,将两样本数据混合后由小到大排列,然后把第一个样 本的 1 n ( n n 1 2  )个变量值的每个变量值,与第二个样本的 2 n 个变量值逐个比较,小于记 0, 相等记 0.5,(大于记 1),检验统计量 U 值是对 1 n 逐个比较记分求和。本方法规定样本为 1 2 n n  , 当 n1 = n2 时,是以平均秩较小( T1 < T2 )的样本为 1 n ,并检验统计量加上 0.5。 当样本 1 n 的每个变量值都大于样本 2 n 的所有变量值时, U n n = 1 2 ;当样本 1 n 的每个变量值都

小于样本n的所有变量值时,U=0。当H。成立时,其U值应大致等于nn,/2,差别是由于随机抽样引起:既从相同总体中随机抽样,获得的U值接近于nn,或0的可能性非常小,根据数理统计推断原理,可以认为在一次抽样中,这样的小概率事件不能发生。如果按上述方法计算的U很接近于n,n,或0,我们就有理由认为H。不成立。例11-3解题步骤如下:1.建立检验假设,确定检验水准H:有无焦虑倾向的大学生完成任务时间的总体分布相同H,:有无焦虑倾向的大学生完成任务时间的总体分布不同α=0.052.计算检验统计量U(1)排序记分将例11-3资料两组数据(完成任务时间)混合由小到大统一排序,本例n=n,=10,焦虑组平均秩较无焦虑组小,故规定焦虑组为n,,见表11-5。焦虑组的每一个值与无焦虑组每一个值比较,焦虑组的第一个观察值65与无焦虑组10个观察值比较均小,记10个0,逐个比较值记为0×10=0;焦虑组的第七个观察值95与无焦虑组10个观察值比较有9个小于记0,有一个值相等记0.5,逐个比较值记为0×9+0.5=0.5,其它依类推。表11-5两组大学生完成任务的时间(分)对比组秩次逐个比较值完成任务时间(1)(2)(3)(4)6510有焦虑n7520有焦虑m78有焦虑mi304083有焦虑n18550有焦虑m9160有焦虑m957.5无焦虑m2一957.50.5有焦虑m9981有焦虑ni9910无焦虑m210011无焦虑m23101有焦虑m1210213无焦虑m210414无焦虑m211105无焦虑m10616 无焦虑m2一17108无焦虑m2一11018无焦虑m2一10

10 小于样本 2 n 的所有变量值时, U = 0 。当 H0 成立时,其 U 值应大致等于 1 2 nn /2 ,差别是由 于随机抽样引起;既从相同总体中随机抽样,获得的 U 值接近于 1 2 nn 或 0 的可能性非常小, 根据数理统计推断原理,可以认为在一次抽样中,这样的小概率事件不能发生。如果按上述 方法计算的 U 很接近于 1 2 nn 或 0,我们就有理由认为 H0 不成立。 例 11-3 解题步骤如下: 1.建立检验假设,确定检验水准 H0 :有无焦虑倾向的大学生完成任务时间的总体分布相同 H1:有无焦虑倾向的大学生完成任务时间的总体分布不同  = 0.05 2.计算检验统计量 U (1)排序记分 将例 11-3 资料两组数据(完成任务时间)混合由小到大统一排序,本例 1 2 n n = =10 ,焦虑 组平均秩较无焦虑组小,故规定焦虑组为 1 n ,见表 11-5。焦虑组的每一个值与无焦虑组每一 个值比较,焦虑组的第一个观察值 65 与无焦虑组 10 个观察值比较均小,记 10 个 0,逐个比 较值记为 0 10 0  = ;焦虑组的第七个观察值 95 与无焦虑组 10 个观察值比较有 9 个小于记 0, 有一个值相等记 0.5,逐个比较值记为 0 9 0.5 0.5  + = ,其它依类推。 表 11-5 两组大学生完成任务的时间(分) 完成任务时间 对比组 秩次 逐个比较值 (1) (2) (3) (4) 65 有焦虑 n1 1 0 75 有焦虑 n1 2 0 78 有焦虑 n1 3 0 83 有焦虑 n1 4 0 85 有焦虑 n1 5 0 91 有焦虑 n1 6 0 95 无焦虑 n2 7.5 — 95 有焦虑 n1 7.5 0.5 98 有焦虑 n1 9 1 99 无焦虑 n2 10 — 100 无焦虑 n2 11 — 101 有焦虑 n1 12 3 102 无焦虑 n2 13 — 104 无焦虑 n2 14 — 105 无焦虑 n2 11 — 106 无焦虑 n2 16 — 108 无焦虑 n2 17 — 110 无焦虑 n2 18 —

共20页,试读已结束,阅读完整版请下载
刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档