中国高校课件下载中心 》 教学资源 》 大学文库

《心理统计学》课程授课教案(讲稿)第十章 卡方检验

文档信息
资源类别:文库
文档格式:DOC
文档页数:14
文件大小:907.5KB
团购合买:点击进入团购
内容简介
《心理统计学》课程授课教案(讲稿)第十章 卡方检验
刷新页面文档预览

第十章2检验问题1.某心理医生认为城市的生活环境更容易使人抑郁,随机调查了25-30岁青年200人,经抑郁自评量表测定,其城市定居者104名中有33人具有抑郁倾向,农村定居者96名中具有抑郁倾向的16人。所收集到的样本数据是否支持该心理医生的观点呢?2.研究人员将某中学32名学生根据各方面条件基本相同的原则配成16对,然后把每对学生随机分入实验组和对照组,实验组的16名学生参加课外科研活动,对照组的16名学生不参加此活动,一学期后,统一进行理解能力测验。结果有9对学生的理解能力测验成绩明显拉开了距离,其中8对是实验组学生得到“及格”,对照组学生得到“不及格”;1对是对照组学生得到“及格”,实验组学生得到“不及格”。参不参加课外科研活动理解能力测验及格率有差别吗?3.某研究者为了解大学新生的生活状态,采用自编学生生活调查问卷对一所大学的100名一年级新生进行了调查。调查项目中有近期情绪(稳定、不稳定)与失眠(是、否)两项,大学新生近期情绪是否稳定与失眠有关吗?联系是否密切?对以上问题需要通过×2检验(chi squaretest)回答。×检验也称卡方检验,是一种广泛使用的假设检验方法。本章将介绍检验在分类变量资料中的应用,即推断两个及两个以上总体率或构成比之间有无差别:两种属性、两种特征或两变量间相关关系是否存在等本章学习目标1.领会×检验的基本思想和应用条件2.熟练掌握独立性检验的各种方法和拟合优度检验3.初步掌握SPSS中检验的操作方法

第十章 2  检验 问题 1. 某心理医生认为城市的生活环境更容易使人抑郁,随机调查了 25-30 岁青年 200 人, 经抑郁自评量表测定,其城市定居者 104 名中有 33 人具有抑郁倾向,农村定居者 96 名中具 有抑郁倾向的 16 人。所收集到的样本数据是否支持该心理医生的观点呢? 2. 研究人员将某中学 32 名学生根据各方面条件基本相同的原则配成 16 对,然后把每 对学生随机分入实验组和对照组,实验组的 16 名学生参加课外科研活动,对照组的 16 名学 生不参加此活动,一学期后,统一进行理解能力测验。结果有 9 对学生的理解能力测验成绩 明显拉开了距离,其中 8 对是实验组学生得到“及格”,对照组学生得到“不及格”;1 对 是对照组学生得到“及格”,实验组学生得到“不及格”。参不参加课外科研活动理解能力 测验及格率有差别吗? 3. 某研究者为了解大学新生的生活状态,采用自编学生生活调查问卷对一所大学的 100 名一年级新生进行了调查。调查项目中有近期情绪(稳定、不稳定)与失眠(是、否)两项, 大学新生近期情绪是否稳定与失眠有关吗?联系是否密切? 对以上问题需要通过 2  检验(chi square test)回答。 2  检验也称卡方检验,是一种广 泛使用的假设检验方法。本章将介绍 2  检验在分类变量资料中的应用,即推断两个及两个 以上总体率或构成比之间有无差别;两种属性、两种特征或两变量间相关关系是否存在等。 本章学习目标 1. 领会 2  检验的基本思想和应用条件 2. 熟练掌握独立性检验的各种方法和拟合优度检验 3. 初步掌握 SPSS 中 2  检验的操作方法

第一节二分类两独立样本比较的检验一、检验的基本思想(一)分布1.×2的基本定义是一个希腊字母(音“卡”),”读作“卡方”或“卡平方”,是表示实际频数与理论频数(期望次数)之间差异程度的指标。若用A表示实际频数,T表示理论频数,则有×=(A-T)/T,可能的取值范围为(0,+)。2.x2分布曲线x分布(chi-squaredistribution)是一种连续型随机变量的概率分布,其分布曲线的形状依赖于自由度v的大小,自由度不同,则曲线分布不同,即α分布曲线是一簇,按其分布的密度函数f(2,v)可绘制自由度v=1,2,3,的2分布曲线图(图10-1)。x表示自由度为v的×2分布,它不是对称分布。×?分布曲线的特点有:①当自由度≤2时,分布曲线呈L型;②当自由度V>2时,×?分布曲线呈右偏态,随着v的增加,曲线逐渐趋于对称;③当自由度V趋于8o时,%分布趋向正态分布。%分布的总体均数就等于其自由度。图10-1不同自由度×2分布的概率密度曲线3.分布的可加性2分布的可加性是其基本性质之一。若独立随机变量X服从自由度V的2分布(即X,~x),独立随机变量X,服从自由度Vz的×分布(即X,~),这两个变量的和(X,+X2)服从自由度(+V2)的分布(即(X,+X2)~+)。4.x分布界值表自由度为V,×分布曲线下右侧尾部的面积为α时,曲线图横轴上对应位置的×值记作称分布的界值。为方便使用,统计学家编制了分布界值表,详细地值与P值的对应关系。2值愈大,P值愈小;反之,×值愈小,P值愈大。×检验时,先计算检验统计量×2值,然后按自由度v查×2界值表,确定P值。(二)检验的基本思想

第一节 二分类两独立样本比较的 2  检验 一、 2  检验的基本思想 (一) 2  分布 1. 2  的基本定义  是一个希腊字母(音“卡”), 2  读作“卡方”或“卡平方”,是表示实际频数与理 论频数(期望次数)之间差异程度的指标。若用 A 表示实际频数,T 表示理论频数,则有 2 2  = − ( ) A T T ,可能的取值范围为 (0, ) + 。 2. 2  分布曲线 2  分布(chi-square distribution)是一种连续型随机变量的概率分布,其分布曲线的形状 依赖于自由度  的大小,自由度不同,则曲线分布不同,即 2  分布曲线是一簇,按其分布 的密度函数 ( , ) 2 f   可绘制自由度  =1,2,3,.的 2  分布曲线图(图 10-1)。 2 ( ) 表 示自由度为  的 2  分布,它不是对称分布。 2  分布曲线的特点有:①当自由度   2 时, 2  分布曲线呈 L 型;②当自由度  >2 时, 2  分布曲线呈右偏态,随着  的增加,曲线逐 渐趋于对称;③当自由度  趋于∞时, 2  分布趋向正态分布。 2  分布的总体均数就等于其 自由度。 图 10-1 不同自由度 2  分布的概率密度曲线 3. 2  分布的可加性 2  分布的可加性是其基本性质之一。若独立随机变量 X1 服从自由度  1 的 2  分布(即 2 1 1 X ~  ),独立随机变量 X2 服从自由度  2 的 2  分布(即 2 2 2 X ~  ),这两个变量的和 ( ) X1 + X2 服从自由度 ( )  1 + 2 的 2  分布(即 ( ) X1 + X2 ~ 2 1  2  + )。 4. 2  分布界值表 自由度为  , 2  分布曲线下右侧尾部的面积为  时,曲线图横轴上对应位置的 2  值 记作 2  , 称 2  分布的界值。为方便使用,统计学家编制了 2  分布界值表,详细地 2  值与 P 值的对应关系。 2  值愈大,P 值愈小;反之, 2  值愈小,P 值愈大。 2  检验时,先计 算检验统计量 2  值,然后按自由度  查 2  界值表,确定 P 值。 (二) 2  检验的基本思想

反应变量是二项分类的两个独立样本的资料,基本数据由两行两列实际频数构成,其参与分析的基本数据格式见表10-1。表10-1二项分类的两个独立样本资料数据格式合计样本阳性数阴性数阳性频率pib样本1a/niaa+b=nid样本2cc+d=n2c/n2合计a+c=m1b+d-m2a+b+c+d=n(a+c)/nab表中是整个分析表的基础,其余数据均由这四个基本数据推算出来。如果反cd应变量为二项分类变量,并是对两个独立样本阳性频率进行比较,称这样的数据格式为四格表(fourfoldtable)资料,又称2×2表资料。a、b、C、d四个数据为实际频数,记作Arc,即对应为A、A2、A、A,,行合计记作nr,列合计记作nc,n为总例数。例10-1某心理医生认为城市的生活环境更容易使人抑郁,随机调查了25-30岁青年200人,其中城市定居者与农村定居者分别为104名和96名。抑郁自评量表测定结果见表10-2,所收集到的样本数据是否支持该心理医生的观点呢?表10-225-30岁城市与农村青年抑郁发生率比较地域抑郁人数非抑郁人数合计抑郁发生率(%)城市31.7333(25.48) a71(78.52)b104(a+b)农村80(72.48)d96(c+d)16.6716(23.52) c合计24.5049(a+c)151(b+d)200(n)*抑郁指有抑郁倾向若例10-1检验假设H:元,=元,确定成立,即两样本率来自同一总体,则无效假设描述为:25-30岁城市青年与农村青年抑郁倾向的总体发生率相等,均等于合计的抑郁倾向发生率24.50%(平均率)。那么计算四个基本数据a、b、C、d所对应的理论频数Trc,25-30岁城市青年104人中理论上有无抑郁倾向者应分别为T,=104×24.50%=25.48、Tz=104(100-24.50)%=78.52;同理,25-30岁农村青年96人中理论上有抑郁倾向者应为T2,=96×24.50%=23.52,无抑郁倾向者T,=96(100-24.50)%=72.48。则任一格子的理论频数T计算公式为Trc =- nnc(10-1)n式中Trc为第R行(row)第C列(column)的理论频数。表10-2括号内数值即为a、b、C、d所对应的理论频数T、T2、TT,的值

反应变量是二项分类的两个独立样本的资料,基本数据由两行两列实际频数构成,其参 与分析的基本数据格式见表 10-1。 表 10-1 二项分类的两个独立样本资料数据格式 样本 阳性数 阴性数 合计 阳性频率 pi 样本 1 a b a+b=n1 a/n1 样本 2 c d c+d=n2 c/n2 合计 a+c=m1 b+d=m2 a+b+c+d=n (a+c)/n 表中 是整个分析表的基础,其余数据均由这四个基本数据推算出来。如果反 应变量为二项分类变量,并是对两个独立样本阳性频率进行比较,称这样的数据格式为四格 表(four fold table)资料,又称 2×2 表资料。 a b c d 、 、 、 四个数据为实际频数,记作 ARC , 即对应为 A A A A 11 12 21 22 、 、 、 ,行合计记作 R n ,列合计记作 Cn , n 为总例数。 例 10-1 某心理医生认为城市的生活环境更容易使人抑郁,随机调查了 25-30 岁青年 200 人,其中城市定居者与农村定居者分别为 104 名和 96 名。抑郁自评量表测定结果见表 10-2,所收集到的样本数据是否支持该心理医生的观点呢? 表 10-2 25-30 岁城市与农村青年抑郁发生率比较 地域 抑郁人数* 非抑郁人数 合计 抑郁发生率(%) 城市 33(25.48) a 71(78.52) b 104(a+b) 31.73 农村 16(23.52) c 80(72.48) d 96(c+d) 16.67 合计 49(a+c) 151(b+d) 200(n) 24.50 *抑郁指有抑郁倾向 若例 10-1 检验假设 H0:  1 2 = 确定成立,即两样本率来自同一总体,则无效假设描述 为:25-30 岁城市青年与农村青年抑郁倾向的总体发生率相等,均等于合计的抑郁倾向发生 率 24.50%(平均率)。那么计算四个基本数据 a b c d 、 、 、 所对应的理论频数 TRC ,25-30 岁城市青年 104 人中理论上有无抑郁倾向者应分别为 11 T =  104 24.50%=25.48、 12 T =104(100-24.50)%=78.52 ;同理,25-30 岁农村青年 96 人中理论上有抑郁倾向者应为 21 T =  96 24.50%=23.52 ,无抑郁倾向者 12 T = 96(100-24.50)%=72.48。则任一格子的理 论频数 T 计算公式为 R C RC n n T n = (10-1) 式中 TRC 为第 R 行(row)第 C 列(column)的理论频数。表 10-2 括号内数值即为 a b c d 、 、 、 所 对应的理论频数 T T T T 11 12 21 22 、 、 、 的值。 a b c d

若无效假设H。:元,=元z为真,则任一格子实际频数A与理论频数T差别不会很大,即Z(A-T)=0,为了消除符号影响,以(A-T)表示,得基本公式:=-A-T)(10-2)T由公式(10-2)可以看出:x2值反映了实际频数与理论频数的吻合程度。若H。成立,实际频A数与理论频T数的差值不会太大,值也会小;反之,若H。不成立,实际频数与理论频数的差值大,则值也会大。同时从公式(102)可以看出:由于(4-)为正值,1x值的大小还随格子数(严格地说是自由度v)的增多而增大,故自由度V愈大,x值也会愈大;所以用x2值准确地反映实际频数A和理论频数T的吻合程度时,必须考虑自由度v的影响。自由度是指可自由选择变动的独立存在的格子数,即自由度V=k-1-计算T时利用样本资料估计的参数个数。k为资料基本数据个数,四格表资料k=4,因为n是确定的,所以自由度v的计算是k-1,同时由于计算T时利用样本资料估计的参数个数有元,和元,两个,故四格表资料的自由度为V=4-1-2=1。推广到一般情况,检验的自由度V可用式(10-3)计算(10-3)V=(R-1)(C-1)式中R为行数,C为列数。四格表自由度为V=(2-1)(2-1)=1检验时确定检验水准为α,计算得到的值,要根据自由度查界值表确定概率P值。当×≥xa,时,P≤α,推断结论是拒绝H。,接受H,有统计学意义;当xα,结论是不拒绝H。,无统计学意义。四格表资料由两行两列实际频数构成,自由度为1,即在周边合计数不变的情况下,4个基本数据当中只有一个可以自由取值,因此,只要根据公式(10-1)计算出一个格子的理论值TRc,其它3个理论值可用周边合计数减去相应的理论值T得出。如例10-1数据,当城市青年有抑郁倾向者T=104×24.5%=25.48时,则有T12=104-25.48=78.52,T,=49-25.48=23.52,Tz=96-23.52=72.48(或T2z=151-78.52=72.48)。公式(10-2)是检验基本公式,不仅可适用于四格表资料,而且也适用于行×列表资料分析。可应用于两个或多个样本率的比较、两个或多个样本构成比的比较、关联性检验等。二、检验步骤例10-1资料的检验步骤如下:1.建立检验假设,确定检验水准H。:元,=元2,即25-30岁城市青年与农村青年抑郁倾向的总体发生率相等H,:元,±元2,即25-30岁城市青年与农村青年抑郁倾向的总体发生率不等α = 0.05

若无效假设 H0 :  1 2 = 为真,则任一格子实际频数 A 与理论频数 T 差别不会很大,即 ( ) 0 A T− = ,为了消除符号影响,以 2 ( ) A T− 表示,得基本公式: 2 2 ( ) A T T  − = (10-2) 由公式(10-2)可以看出: 2  值反映了实际频数与理论频数的吻合程度。若 0 H 成立,实 际频 A 数与理论频 T 数的差值不会太大, 2  值也会小;反之,若 0 H 不成立,实际频数与 理论频数的差值大,则 2  值也会大。同时从公式(10-2)可以看出:由于 2 ( ) A T T − 为正值, 2  值的大小还随格子数(严格地说是自由度  )的增多而增大,故自由度  愈大, 2  值 也会愈大;所以用 2  值准确地反映实际频数 A 和理论频数 T 的吻合程度时,必须考虑自由 度  的影响。自由度是指可自由选择变动的独立存在的格子数,即自由度  = − − k 1 计算 T 时利用样本资料估计的参数个数。 k 为资料基本数据个数,四格表资料 k = 4 ,因为 n 是确 定的,所以自由度  的计算是 k −1 ,同时由于计算 T 时利用样本资料估计的参数个数有  1 和  2 两个,故四格表资料的自由度为  = − − = 4 1 2 1。 推广到一般情况, 2 检验的自由度  可用式(10-3)计算  = − − ( 1)( 1) R C (10-3) 式中 R 为行数,C 为列数。四格表自由度为  = − − = (2 1)(2 1) 1 检验时确定检验水准为  ,计算得到的 2  值,要根据自由度  查 2  界值表确定概率 P 值。当 2 2     , 时, P   ,推断结论是拒绝 H0 ,接受 H1 ,有统计学意义;当 2 2     , 时, P   ,结论是不拒绝 H0 ,无统计学意义。 四格表资料由两行两列实际频数构成,自由度为 1,即在周边合计数不变的情况下,4 个基本数据当中只有一个可以自由取值,因此,只要根据公式(10-1)计算出一个格子的理论 值 TRC ,其它 3 个理论值可用周边合计数减去相应的理论值 T 得出。如例 10-1 数据,当城 市 青 年 有 抑 郁 倾 向 者 11 T =  = 104 24.5% 25.48 时 , 则 有 12 T = − = 104 25.48 78.52 , 21 T = − = 49 25.48 23.52 , 22 T = − = 96 23.52 72.48 (或 22 T = − = 151 78.52 72.48 )。 公式(10-2)是 2  检验基本公式,不仅可适用于四格表资料,而且也适用于行×列表资料 分析。可应用于两个或多个样本率的比较、两个或多个样本构成比的比较、关联性检验等。 二、检验步骤 例 10-1 资料的检验步骤如下: 1.建立检验假设,确定检验水准 0 H : 1 =  2 ,即 25-30 岁城市青年与农村青年抑郁倾向的总体发生率相等 1 H : 1   2 ,即 25-30 岁城市青年与农村青年抑郁倾向的总体发生率不等  = 0.05

2.计算检验统计量按公式(10-1)、公式(10-2)、公式(10-3)分别计算理论频数TRc、2值、自由度vT,=104×24.5%=25.48T,=78.52T,=23.52Tz=72.48-3548)+17852)+(162352) +(80-7248) =6.1225.4878.5272.4823.52V=(2-1)(2-1)=13.确定P值并推断结论以V=1查×2界值,得0.01<P<0.025:SPSS软件运行结果×2=6.124,V=1,P=0.013。按α=0.05检验水准拒绝H。,接受H,,有统计学意义。可以认为25-30岁城市青年与农村青年抑郁倾向的总体发生率不等,即可认为25-30岁城市青年的抑郁倾向发生率高于农村青年的发生率。三、四格表资料×检验的专用公式为简化计算过程,可将计算Pearson×2值的基本公式(10-2)转化为四格表专用公式(10-4)用于两样本率的比较。四格表资料%检验的专用公式为(ad - bc)nx=V=1(10-4)(a+b)(c+d)(a+c)(b+d)式中a,b,c,d为四格表的实际频数:(a+b),(c+d),a+c),(b+d)为周边合计数:n为总例数,即n=a+b+c+d。相应符号参见表10-1。公式(10-4)省去了计算理论频数的步骤,在不具备使用统计软件分析数据的条件时,常用公式(10-4)计算检验统计量值。例10-1资料用公式(10-4)计算×2值2=(33×80-16×71)*2002=6.12104×96×49×151计算结果与用公式(10-2)的完全相同。四、四格表资料检验的校正公式x检验是建立在渐进分布理论的基础上,要求样本量足够以保证其代表性,并要求各理论频数Tc≥5。?界值表中的界值是依据连续型2分布算得,而计数资料中的实际频数是不连续的分类资料,由公式(10-2)计算的×2值是离散型分布。计算出的×2值去查×界值表所得的概率P偏小,尤其是自由度v为1的四格表资料。所以对四格表资料来说,若n≥40,但有1≤T<5时,计算得%值偏大,必须加以校正。1934年,美国统计学家F.Yates提出了用|A-T|-0.5计算×的连续性校正法:x =4-7l-0.5)2, V=l(10-5)T(ad -bc|-号)"nx=(10-6)V=I(a+b)(c+d)(a+c)(b+d)公式(10-5)和公式(10-6)分别是公式(10-2)和公式(10-4)的校正。这种校正可以减小×~值而加大概率P。α连续性校正仅用于v=1的四格表资料,尤其是n较小时。当v≥2时,一般不作校正。例10-2某地区教委在甲、乙两所中学按毕业班学生总数比例随机抽取78名毕业班学生进行中考语文统一模拟测验,测验成绩85分以上为达标,结果见表10-3。问两所中学语文模拟测验的达标率是否相等?

2.计算检验统计量 按公式(10-1)、公式(10-2)、公式(10-3)分别计算理论频数 TRC 、 2  值、自由度  11 T =  = 104 24.5% 25.48 12 T = 78.52 21 T = 23.52 22 T = 72.48 2 2 2 2 2 (33-25.48) (71-78.52) (16-23.52) (80-72.48) = + + + = 6.12 25.48 78.52 23.52 72.48   = − − = (2 1)(2 1) 1 3.确定 P 值并推断结论 以  =1 查 2  界值,得 0.01 0.025   P ;SPSS 软件运行结果 2  = 6.124 , =1, P = 0.013。 按  = 0.05 检验水准拒绝 0 H ,接受 1 H ,有统计学意义。可以认为 25-30 岁城市青年与 农村青年抑郁倾向的总体发生率不等,即可认为 25-30 岁城市青年的抑郁倾向发生率高于农 村青年的发生率。 三、四格表资料 2  检验的专用公式 为简化计算过程,可将计算 Pearson 2  值的基本公式 (10-2)转化为四格表专用公式 (10-4)用于两样本率的比较。四格表资料 2  检验的专用公式为 ( )( )( )( ) ( ) 2 2 a b c d a c b d ad bc n + + + + −  = ,  =1 (10-4) 式中 a , b , c , d 为四格表的实际频数; (a + b) , (c + d), (a + c),(b + d) 为周边合计数; n 为 总例数,即 n = a +b + c + d 。相应符号参见表 10-1。 公式(10-4)省去了计算理论频数的步骤,在不具备使用统计软件分析数据的条件时,常 用公式(10-4)计算检验统计量 2  值。 例 10-1 资料用公式(10-4)计算 2  值 2 2 (33 80 16 71) 200 6.12 104 96 49 151   −  = =    计算结果与用公式(10-2)的完全相同。 四、四格表资料 2  检验的校正公式 2  检验是建立在渐进分布理论的基础上,要求样本量足够以保证其代表性,并要求各 理论频数 5 TRC  。 2  界值表中的界值是依据连续型 2  分布算得,而计数资料中的实际频 数是不连续的分类资料,由公式(10-2)计算的 2  值是离散型分布。计算出的 2  值去查 2  界值表所得的概率 P 偏小,尤其是自由度  为 1 的四格表资料。所以对四格表资料来说, 若 n  40,但有 1 T  5 时,计算得 2  值偏大,必须加以校正。1934 年,美国统计学家 F.Yates 提出了用 | | 0.5 A T− − 计算 2  的连续性校正法: 2 2 ( 0.5) C A T T  − − =  , =1 (10-5) 2 2 2 ( ) ( )( )( )( ) n C | ad -bc|- n = a+b c+d a+c b+d  , =1 (10-6) 公式(10-5)和公式(10-6)分别是公式(10-2)和公式(10-4)的校正。这种校正可以减小 2  值 而加大概率 P。 2  连续性校正仅用于  =1 的四格表资料,尤其是 n 较小时。当   2 时, 一般不作校正。 例 10-2 某地区教委在甲、乙两所中学按毕业班学生总数比例随机抽取 78 名毕业班学 生进行中考语文统一模拟测验,测验成绩 85 分以上为达标,结果见表 10-3。问两所中学语 文模拟测验的达标率是否相等?

表10-3两所中学测验的达标率比较学校达标合计未达标达标率(%)甲校4665288.4618乙校268 (4.67)69.23合计64 107882.05例10-2资料的检验步骤如下:1:建立检验假设,确定检验水准H。:元,=元2,即两所中学语文模拟测验的达标率相等H:元,±元2,即两所中学语文模拟测验的达标率不等α=0.052.计算检验统计量本例n=78>40,但有一个格子的理论频数为4.67,需用四格表资料×2检验的校正公式(10-5)或公式(10-6)。用公式(10-6)计算校正×值为(46×8-6×18-78/2)×782=3.1452×26×64×143.确定P值并推断结论V=1,查×2界值表得0.05<P<0.10SPSS软件运行结果P=0.058(该软件不提供校正值,直接给出四格表资料的Fisher确切概率值)。按α=0.05检验水准不拒绝H。,尚不能认为两所中学语文模拟测验的达标率不等。本资料若不进行×值校正,则×2=4.35,P<0.05,拒绝H。,结论与校正后的相反。注意,最小理论频数TRc的判断:R行与C列中,行合计数中的最小值与列合计数中的最小值所对应格子的理论频数最小。如本例(表10-3),第2行与第2列所对应的格子理论频数最小,T2=26×14/78=4.67。对于四格表资料的分析,通常规定:(1)当n≥40且所有的T≥5时,用×2检验的基本公式(10-2)或四格表资料×2检验的专用公式(10-4):当P~α时,改用四格表资料的Fisher确切概率法为妥。(2)当n≥40但有1≤T<5时,用四格表资料×2检验的校正公式(10-5)或(10-6)或改用四格表资料的Fisher确切概率法。(3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。※五、四格表资料的Fisher确切概率法1934年,R.A.Fisher提出该法,简称Fisher确切概率法。其理论依据是超几何分布,并非检验的范畴。本法可作为四格表资料假设检验的补充,故列入此章介绍。四格表资料,若出现n<40,或T<1,或作×2检验所得概率Pα时,需改用四格表资料的Fisher确切概率法进行统计推断。确切概率法的基本思想:在四格表边缘合计固定不变的条件下,实际频数a,bcd变动组合四格表的概率P服从超几何分布,其和为1。按公式(10-7)计算四格表中四个基本数据的各种组合概率P,然后再根据所需的单侧或双侧检验计算当前四格表更极端情况的累计概率P,与检验水准α比较,作出是否拒绝H。的结论

表 10-3 两所中学测验的达标率比较 学校 达标 未达标 合计 达标率(%) 甲校 46 6 52 88.46 乙校 18 8(4.67) 26 69.23 合计 64 10 78 82.05 例 10-2 资料的检验步骤如下: 1.建立检验假设,确定检验水准 H0 : 1 =  2 ,即两所中学语文模拟测验的达标率相等 H1: 1   2 ,即两所中学语文模拟测验的达标率不等  = 0.05 2.计算检验统计量 本例 n =  78 40 ,但有一个格子的理论频数为 4.67,需用四格表资料 2  检验的校正 公式(10-5)或公式(10-6)。用公式(10-6)计算校正 2  值为 2 2 ( 46 8 6 18 78 / 2) 78 3.14 52 26 64 14  C  −  −  = =    3.确定 P 值并推断结论  =1 ,查 2  界值表得 0.05 P  0.10 ;SPSS 软件运行结果 P = 0.058 (该软件不 提供校正 2  值,直接给出四格表资料的 Fisher 确切概率值)。 按  = 0.05 检验水准不拒绝 H0 ,尚不能认为两所中学语文模拟测验的达标率不等。 本资料若不进行 2  值校正,则 4.35 2  = , P  0.05,拒绝 H0 ,结论与校正后的相反。 注意, 最小理论频数 TRC 的判断: R 行与 C 列中,行合计数中的最小值与列合计数中 的最小值所对应格子的理论频数最小。如本例(表 10-3),第 2 行与第 2 列所对应的格子理 论频数最小, 22 T = 26 14 78 4.67  = 。 对于四格表资料的分析,通常规定: (1)当 n  40 且所有的 T  5 时,用 2  检验的基本公式(10-2)或四格表资料 2  检验 的专用公式(10-4);当 P  时,改用四格表资料的 Fisher 确切概率法为妥。 (2)当 n  40 但有 1 T  5 时,用四格表资料 2  检验的校正公式 (10-5)或(10-6); 或改用四格表资料的 Fisher 确切概率法。 (3)当 n  40 ,或 T  1 时,用四格表资料的 Fisher 确切概率法。 ※五、四格表资料的 Fisher 确切概率法 1934 年,R.A.Fisher 提出该法,简称 Fisher 确切概率法。其理论依据是超几何分布,并 非 2  检验的范畴。本法可作为四格表资料假设检验的补充,故列入此章介绍。四格表资料, 若出现 n  40 ,或 T  1 ,或作 2  检验所得概率 P  时,需改用四格表资料的 Fisher 确 切概率法进行统计推断。 确切概率法的基本思想:在四格表边缘合计固定不变的条件下,实际频数 a ,b ,c , d 变 动组合四格表的概率 Pi 服从超几何分布,其和为 1。按公式(10-7)计算四格表中四个基本数 据的各种组合概率 Pi ,然后再根据所需的单侧或双侧检验计算当前四格表更极端情况的累 计概率 P ,与检验水准  比较,作出是否拒绝 H0 的结论

(a+b)!(c+b)!(a+c)!(b+d)!(10-7)a!b!c!d!n!以例10-3介绍其检验步骤。例10-3有研究者预见儿童早期被虐待可能导致青年期的犯罪行为。分别选取22名在校大学生和青年罪犯11名,询问早期被虐待的经历,结果见表10-8,试比较罪犯是否比大学生有更多的早期被虐待的经历?表10-4罪犯与大学生儿童早期被虐待率的比较早期被虐待经历合计对比组别被虐待率(%)有无74罪犯1163.64大学生2261627.27合计13203339.391.建立检验假设,确定检验水准H。:元,=元2,即罪犯与大学生儿童早期被虐待率相等H,:元,>元2,即罪犯儿童早期被虐待率高于大学生α=0.052.利用SPSS软件计算概率SPSS软件运行结果:Fishier双侧检验的累计概率值为0.065:单侧累计概率值为0.051。3.确定P值并推断结论本例根据分析目的设立的H,为元,元,,即罪犯儿童早期被虐待率高于大学生,所以应选用单侧累计概率值0.051。按α=0.05检验水准不拒绝H。,无统计学意义,尚不能认为罪犯比大学生有更多的早期被虐待的经历。如果没有专业上的理由认为罪犯不会低于大学生的儿童早期被虐待率,则H,:元,≠元,,进行双侧检验(比单侧检验更常用),双侧累计概率P=0.065,结论同单侧检验。第二节配对设计两组率比较的检验在一些心理学研究中为了控制随机误差而采用配对设计方案。先将配对条件相似的两个受试对象配成一对,之后随机分配其中一个接受A处理,另一个接受B处理,处理的效应都按二项分类(阳性或阴性、成功或不成功、有效或无效等),每一对的结果有四种可能,即A+、B+(处理都阳性),A-、B.(处理都阴性),A+、B.(A处理阳性而B阴性),A-、B(A处理阴性而B阳性)。资料的格式见表10-5。表10-5配对设计二项分类的基本数据格式处理B合计处理A阳性阴性b阳性ani阴性dcn2合计m1m2n(固定值)这类设计的数据亦表示为四格表形式,表10-5和表10-2的区别在于设计:表10-2的数据是两个独立样本,样本量n、m2(行合计)是事先固定的。而配对设计只有一个样本

( )! ! ! ! ( ) ( ) ( ) ! ! ! ! ! i a b c b a c b d P a b c d n + + + + = (10-7) 以例 10-3 介绍其检验步骤。 例 10-3 有研究者预见儿童早期被虐待可能导致青年期的犯罪行为。分别选取 22 名在 校大学生和青年罪犯 11 名,询问早期被虐待的经历,结果见表 10-8,试比较罪犯是否比大 学生有更多的早期被虐待的经历? 表 10-4 罪犯与大学生儿童早期被虐待率的比较 对比组别 早期被虐待经历 合计 被虐待率(%) 有 无 罪犯 7 4 11 63.64 大学生 6 16 22 27.27 合计 13 20 33 39.39 1.建立检验假设,确定检验水准 H0 : 1 =  2 ,即罪犯与大学生儿童早期被虐待率相等 H1:  1 2  ,即罪犯儿童早期被虐待率高于大学生  = 0.05 2.利用 SPSS 软件计算概率 SPSS 软件运行结果:Fishier 双侧检验的累计概率值为 0.065;单侧累计概率值为 0.051。 3.确定 P 值并推断结论 本例根据分析目的设立的 H1 为   1 2  ,即罪犯儿童早期被虐待率高于大学生,所以 应选用单侧累计概率值 0.051。 按  = 0.05 检验水准不拒绝 H0 ,无统计学意义,尚不能认为罪犯比大学生有更多的早 期被虐待的经历。 如果没有专业上的理由认为罪犯不会低于大学生的儿童早期被虐待率,则 1 1 2 H :   , 进行双侧检验(比单侧检验更常用),双侧累计概率 P = 0.065 ,结论同单侧检验。 第二节 配对设计两组率比较的 2  检验 在一些心理学研究中为了控制随机误差而采用配对设计方案。先将配对条件相似的两 个受试对象配成一对,之后随机分配其中一个接受 A 处理,另一个接受 B 处理,处理的效 应都按二项分类(阳性或阴性、成功或不成功、有效或无效等),每一对的结果有四种可能, 即 A+、B+(处理都阳性),A-、B-(处理都阴性),A+、B-(A 处理阳性而 B 阴性),A-、B+ (A 处理阴性而 B 阳性)。资料的格式见表 10-5。 表 10-5 配对设计二项分类的基本数据格式 处理 A 处理 B 合计 阳性 阴性 阳性 a b n1 阴性 c d n2 合计 m1 m2 n (固定值) 这类设计的数据亦表示为四格表形式,表 10-5 和表 10-2 的区别在于设计:表 10-2 的 数据是两个独立样本,样本量 n1、n2(行合计)是事先固定的。而配对设计只有一个样本

即“两份样本”互不独立,其样本量都是n,是固定的,行合计nl、n2是事先不确定的。这种配对设计资料根据研究目的不同可进行两种不同的检验。当研究的目的是为比较两种处理的阳性概率是否相等时,需进行McNemar检验(McNemartest)。例10-4某小学根据各方面条件基本相同的原则将32名学生配成16对,然后把每对学生随机分入实验组和对照组,实验组的16名学生参加课外科研活动,对照组的16名学生不参加此活动,一学期后,统一进行理解能力测验。结果发现,有9对学生的理解能力测验成绩明显拉开了距离,其中8对是实验组学生得到“及格”,对照组学生得到“不及格”;1对是对照组学生得到“及格”,实验组学生得到“不及格”。问:参不参加课外科研活动理解能力测验及格率有无差别?表10-6两组学生理解能力测验成绩对照组试验组合计及格不及格及格5813123不及格61016合计根据例10-4提出的问题检验假设H。为元,=元2,即两组学生理解能力测验成绩及格率相等显然,试验组及格率P==α+bm_a+c对照组及格率PBnnnna+bb-ca+c两组及格率的差值:PA-PBnnn可见,两组及格率的比较仅与b、c有关,而与a、d无关。a,d为两组测验结果一致的两种情况,b,c为两组测验结果不一致的两种情况。将两组不一致的总例数b+c视为固定值,在此条件下进行推断无需考虑两组一致的例数a和d的大小。这类方法在统计学中称为条件推断。当H。成立时(两组测验成绩无差别),对总体有B=C,两个格子的理论频数均应为b+c/2。由于在抽样研究中,抽样误差不可避免,样本中的b和c往往不会正好相等。其检验统计量为:b+cb+cb22x2V=1(10-8)b+cb+c22简化计算公式为23_(b-c)2V=1(10-9)b+c若b+C<40需对值进行校正,其公式为2= b-d-1v=1(10-10)b+c例10-4资料的检验步骤如下:1.建立检验假设,确定检验水准H。:B=C,即两组学生理解能力测验及格率相等H:B≠C,即两组学生理解能力测验及格率不等2.计算检验统计量例10-4资料b=8,c=1,b+c<40,按公式(10-10)计算

即“两份样本”互不独立,其样本量都是 n ,是固定的,行合计 n1、n2 是事先不确定的。这 种配对设计资料根据研究目的不同可进行两种不同的 2  检验。当研究的目的是为比较两种 处理的阳性概率是否相等时,需进行 McNemar 检验(McNemar test)。 例 10-4 某小学根据各方面条件基本相同的原则将 32 名学生配成 16 对,然后把每对学 生随机分入实验组和对照组,实验组的 16 名学生参加课外科研活动,对照组的 16 名学生不 参加此活动,一学期后,统一进行理解能力测验。结果发现,有 9 对学生的理解能力测验成 绩明显拉开了距离,其中 8 对是实验组学生得到“及格”,对照组学生得到“不及格”;1 对是对照组学生得到“及格”,实验组学生得到“不及格”。问:参不参加课外科研活动理 解能力测验及格率有无差别? 表 10-6 两组学生理解能力测验成绩 试验组 对照组 合计 及格 不及格 及格 5 8 13 不及格 1 2 3 合计 6 10 16 根据例 10-4 提出的问题检验假设 0 H 为  1 =  2,即两组学生理解能力测验成绩及格率 相等 显然,试验组及格率 1 A n a b p n n + = = ,对照组及格率 1 B m a c p n n + = = 两组及格率的差值: A B a b a c b c p p n n n + + − − = − = 可见,两组及格率的比较仅与 b 、c 有关,而与 a 、d 无关。 a , d 为两组测验结果一致的两 种情况, b , c 为两组测验结果不一致的两种情况。将两组不一致的总例数 b c + 视为固定值, 在此条件下进行推断无需考虑两组一致的例数 a 和 d 的大小。这类方法在统计学中称为条件 推断。当 0 H 成立时(两组测验成绩无差别),对总体有 B =C ,两个格子的理论频数均应 为 b c + /2 。由于在抽样研究中,抽样误差不可避免,样本中的 b 和 c 往往不会正好相等。 其检验统计量为: 2 2 2 2 2 b c b c b c b c b c      + + − −         = + + + ,  =1 (10-8) 简化计算公式为 b c b c + − = 2 2 ( )  ,  =1 (10-9) 若 b c +  40 需对 2  值进行校正,其公式为 2 2 ( 1) C b c b c  − − = + ,  =1 (10-10) 例 10-4 资料的检验步骤如下: 1.建立检验假设,确定检验水准 0 H : B C= ,即两组学生理解能力测验及格率相等 1 H : B C ,即两组学生理解能力测验及格率不等 2.计算检验统计量 例 10-4 资料 b = 8,c =1,b c +  40 ,按公式(10-10)计算

(81|-1)228+13.确定P值并推断结论V=1,查×2界值表得0.025<P<0.05;SPSS软件运行结果为P=0.039(该软件不提供校正值,直接给出McNemar检验的确切概率值)。按α=0.05检验水准拒绝H。,接受H,,可以认为两组学生理解能力测验及格率有差别,即参加课外科研活动理解能力测验的及格率提高了。第三节行×列表资料的检验行×列表资料的基本数据有3种情况:①多个独立样本率比较时,数据有R个对比组(行),每组2个水平(列),称为R×2表:②两个独立样本的构成比比较时,数据有2个对比组(行),每组C个水平(列),称2×C表:③多个独立样本的构成比比较时,数据有R个对比组(行),每组C个水平(列),称为R×C表:关联性检验时,双向无序分类R行C列资料也称R×C表(见本章第四节)。以上3种情况可统称为行×列表资料。行×列表资料的×2检验仍可用基本计算公式(10-2),但行×列表资料的格子数增多,每个格子先用公式(10-1)计算理论频数TRc,再计算统计量×2值过于繁琐,可将公式(10-2)化简,得行×列表资料×2检验的专用公式(10-11)Ax=n(-1),(10-11)V=(R-1)(C-1)nRnc式中A为每个格子中的实际频数,n和nc分别为与A对应的第R行合计数与第C列合计数,n为总例数。、多个独立样本率的比较例10-5为有效干预大学生心理危机发生,降低自杀危险性,某课题组对某所综合性大学纯文科类、纯理科类、文理兼备类各专业的大学生进行了问卷的抽样调查。回收有效问卷308份,问卷结果见表10-7。试比较大学不同学科类别学生自杀意念发生率(%)有无差别?表10-7大学不同学科类别学生自杀意念发生率(%)比较自杀意念学科类别合计自杀意念发生率(%)有无3174纯文科类10529.52158499纯理科类15.152084文理兼备类10419.23合计6624230821.43例10-5资料的检验步骤如下:1.建立检验假设,确定检验水准H。:元,=元,=元3,即大学不同学科类别学生自杀意念发生率相等H:大学不同学科类别学生自杀意念发生率不全相等α=0.052.计算检验统计量用公式(10-11)计算×值及自由度v742842312x=308(1)=6.702105×66105×242104×242

2 2 ( 8 1 1) 4 8 1  C − − = = + 3.确定 P 值并推断结论  =1,查 2  界值表得 0.025 0.05   P ;SPSS 软件运行结果为 P = 0.039 (该软件 不提供校正 2  值,直接给出 McNemar 检验的确切概率值)。 按  = 0.05 检验水准拒绝 H0 ,接受 H1 ,可以认为两组学生理解能力测验及格率有差 别,即参加课外科研活动理解能力测验的及格率提高了。 第三节 行×列表资料的 2  检验 行  列表资料的基本数据有3种情况:①多个独立样本率比较时,数据有 R 个对比组(行), 每组 2 个水平(列),称为 R 2 表;②两个独立样本的构成比比较时,数据有 2 个对比组(行), 每组 C 个水平(列),称 2C 表;③多个独立样本的构成比比较时,数据有 R 个对比组(行), 每组 C 个水平(列),称为 RC 表;关联性检验时,双向无序分类 R 行 C 列资料也称 RC 表(见本章第四节)。以上 3 种情况可统称为行  列表资料。 行  列表资料的 2  检验仍可用基本计算公式(10-2),但行  列表资料的格子数增多,每 个格子先用公式(10-1)计算理论频数 TRC ,再计算统计量 2  值过于繁琐,可将公式(10-2)化 简,得行  列表资料 2  检验的专用公式(10-11) ( 1) 2 2 =  − nR nC A  n ,  = − − ( 1)( 1) R C (10-11) 式中 A 为每个格子中的实际频数, R n 和 C n 分别为与 A 对应的第 R 行合计数与第 C 列合计 数, n 为总例数。 一、多个独立样本率的比较 例 10-5 为有效干预大学生心理危机发生,降低自杀危险性,某课题组对某所综合性大 学纯文科类、纯理科类、文理兼备类各专业的大学生进行了问卷的抽样调查。回收有效问卷 308 份,问卷结果见表 10-7。试比较大学不同学科类别学生自杀意念发生率(%)有无差别? 表 10-7 大学不同学科类别学生自杀意念发生率(%)比较 学科类别 自杀意念 合计 自杀意念发生率(%) 有 无 纯文科类 31 74 105 29.52 纯理科类 15 84 99 15.15 文理兼备类 20 84 104 19.23 合计 66 242 308 21.43 例 10-5 资料的检验步骤如下: 1.建立检验假设,确定检验水准 H0 :   1 2 3 = = ,即大学不同学科类别学生自杀意念发生率相等 H1:大学不同学科类别学生自杀意念发生率不全相等  = 0.05 2.计算检验统计量 用公式(10-11)计算 2  值及自由度  2 2 2 2 31 74 84 308( 1) 6.702 105 66 105 242 104 242  = + + + − =   

V= (3-1)(2-1)=23.确定P值并推断结论V=2,查×2界值表得0.025<P<0.05;SPSS软件运行结果为×2=4.914,df=2,P=0.035按α=0.05检验水准拒绝H。,接受H,,可以认为大学不同学科类别学生自杀意念发生率有差别,纯文科类学生的自杀意念发生率最高。对例10-5x2检验的推断结论为拒绝H。,接受H,,H,为各对比组总体率不全相等,即多组中至少有两组间总体率是不等的,并不能说明任两个总体率之间全都不相等。通常研究者做多组率比较的目的并不仅限于得出各总体率之间总的来说有差别的结论,更关心任两个总体率之间是否有差别。所以,对这种多个独立样本率比较的资料,若检验推断结论为有统计学意义,还需要对资料做进一步多重比较分析,来说明任两个总体率之间有无差别。多重比较分析方法请参考其它相关书籍。二、独立样本构成比的比较例10-6某研究者为探讨中国汉族人色氨酸羟化酶(TPH)基因A218C多态性与单相抑郁症的关系,选择到某医院精神科就诊的单相抑郁症患者132例,同时选择到该医院体检中心行健康检查的102名正常人作为对照,两组均为汉族人,年龄、性别均衡,资料见表10-8,问单相抑郁症患者与正常对照的TPHA218C基因型总体分布有无差别?表10-8病例组和对照组TPHA218C基因型分布的比较基因型组别合计A/CCICA/A305448132病例组386044102对照组6811092274合计例10-6资料的检验步骤如下:1:建立检验假设,确定检验水准H。:单相抑郁症患者与正常对照TPHA218C基因型的总体构成比相同H,:单相抑郁症患者与正常对照TPHA218C基因型的总体构成比不同α=0.052.计算检验统计量按公式(10-11)计算×2值及自由度v302542442x=274(1)=1.067132×68132×114142×92v= (2 -1)(3 -1) = 23.确定P值并推断结论V=2,查×界值表得0.500<P<0.750:SPSS软件运行结果为x2=1.067,df=2,P=0.586。按α=0.05检验水准不拒绝H。,尚不能认为单相抑郁症患者与正常对照的TPHA218C基因型总体分布有差别。三、行×列表×检验注意事项

 = (3 −1)(2 −1) = 2 3.确定 P 值并推断结论  = 2 ,查 2  界值表得 0.025 0.05   P ;SPSS 软件运行结果为 2  = 4.914 , df = 2 , P = 0.035。 按  = 0.05 检验水准拒绝 H0 ,接受 H1,可以认为大学不同学科类别学生自杀意念发 生率有差别,纯文科类学生的自杀意念发生率最高。 对例 10-5 2  检验的推断结论为拒绝 H0 ,接受 H1 ,H1 为各对比组总体率不全相等,即 多组中至少有两组间总体率是不等的,并不能说明任两个总体率之间全都不相等。通常研究 者做多组率比较的目的并不仅限于得出各总体率之间总的来说有差别的结论,更关心任两个 总体率之间是否有差别。所以,对这种多个独立样本率比较的资料,若 2  检验推断结论为有 统计学意义,还需要对资料做进一步多重比较分析,来说明任两个总体率之间有无差别。多 重比较分析方法请参考其它相关书籍。 二、独立样本构成比的比较 例 10-6 某研究者为探讨中国汉族人色氨酸羟化酶(TPH)基因 A218C 多态性与单相抑 郁症的关系,选择到某医院精神科就诊的单相抑郁症患者 132 例,同时选择到该医院体检中 心行健康检查的 102 名正常人作为对照,两组均为汉族人,年龄、性别均衡,资料见表 10-8, 问单相抑郁症患者与正常对照的 TPHA218C 基因型总体分布有无差别? 表 10-8 病例组和对照组 TPHA218C 基因型分布的比较 组别 基因型 合计 A/A A/C C/C 病例组 30 54 48 132 对照组 38 60 44 102 合计 68 110 92 274 例 10-6 资料的检验步骤如下: 1.建立检验假设,确定检验水准 H0 :单相抑郁症患者与正常对照 TPHA218C 基因型的总体构成比相同 H1:单相抑郁症患者与正常对照 TPHA218C 基因型的总体构成比不同  = 0.05 2.计算检验统计量 按公式(10-11)计算 2  值及自由度  2 2 2 2 30 54 44 274( 1) 1.067 132 68 132 114 142 92  = + + + − =     = (2 −1)(3 −1) = 2 3.确定 P 值并推断结论  = 2 ,查 2  界值表得 0.500 0.750   P ;SPSS 软件运行结果为 2  =1.067 ,df = 2 , P = 0.586。 按  = 0.05 检验水准不拒绝 H0 ,尚不能认为单相抑郁症患者与正常对照的 TPHA218C 基因型总体分布有差别。 三、行  列表 2  检验注意事项

共14页,试读已结束,阅读完整版请下载
刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档