中国高校课件下载中心 》 教学资源 》 大学文库

《心理统计学》课程授课教案(讲稿)第六章 假设检验

文档信息
资源类别:文库
文档格式:DOC
文档页数:4
文件大小:61.5KB
团购合买:点击进入团购
内容简介
《心理统计学》课程授课教案(讲稿)第六章 假设检验
刷新页面文档预览

第六章假设检验问题心理学家从某中学随机抽取100名初中学生,获得他们期末数学成绩,结果男生平均分为85,标准差为6:女生平均分为78,标准差为8。这一结果是否意味着男女生数学水平确实存在差异?某临床心理学家对抑郁症患者进行临床研究,他将确诊的抑郁症患者按来诊顺序的单双号分为两组,一组接受认知行为治疗,另一组接受传统支持治疗,同时采用抑郁症状评定量表评价治疗效果。一个月后发现认知行为治疗组的抑郁症状量表平均分为20,标准差为8;支持治疗组的抑郁症状量表平均分为30,标准差为10。这一研究结果是否说明认知行为治疗方法优于传统支持治疗呢?由于上例研究结果的差异来自样本,存在抽样误差,不能断然地做出有实际差异的推论,而应提出有关差异的假设检验和进行相应统计分析。假设检验是统计学中最重要的概念之一,是统计推论的核心,因此正确地理解假设检验的思想,掌握假设检验的方法与步骤,对统计学的学习和应用具有十分重要的意义。学习目标1.理解假设检验的原理2.掌握假设检验的基本过程3.了解统计推断的两类错误4.了解假设检验应注意的问题第一节检验假设的基本原理一、抽样研究与抽样误差在科学研究中,通常是在研究对象的总体中抽取一定数量的个体作为样本进行研究,即抽样研究,然后有样本信息(样本统计量)推断总体特征。这个过程称为统计推断。抽样研究时,由于个体存在差异,通过样本推论总体时会存在一定的误差,这种由抽样造成的样本均数与总体均数的差异称为抽样误差。二、两种差异与假设检验在本章开始问题中提到的心理学研究中遇到的不同组间差异问题,主要有两种情况。一是组间本身存在着真实差异或实质性差异:另一种则是因为本身并无差异,但是由于抽样的随机性而出现了差异,即属于抽样误差,这种差异被视为没有实质性的差异。因此,当两个事物之间出现差异时,可以提出两种假设:一个假设是:两个总体均数相等,差异仅由抽样误差所致,两个事物之间没有差异。此称为无效假设(nullhypothesis),用Ho示,即Ho:μ,=μ2。另一个假设是:两组总体均数不等,其差异不仅仅是由抽样误差所致,两个事物之间存在着实质性差异。此称为备择假设alternativehypothesis),用H表示,即H:μ,μ2,1

1 第六章 假设检验 问题 心理学家从某中学随机抽取 100 名初中学生,获得他们期末数学成绩,结果男生平均分 为 85,标准差为 6;女生平均分为 78,标准差为 8。这一结果是否意味着男女生数学水平确 实存在差异? 某临床心理学家对抑郁症患者进行临床研究,他将确诊的抑郁症患者按来诊顺序的单双 号分为两组,一组接受认知行为治疗,另一组接受传统支持治疗,同时采用抑郁症状评定量 表评价治疗效果。一个月后发现认知行为治疗组的抑郁症状量表平均分为 20,标准差为 8; 支持治疗组的抑郁症状量表平均分为 30,标准差为 10。这一研究结果是否说明认知行为治 疗方法优于传统支持治疗呢? 由于上例研究结果的差异来自样本,存在抽样误差,不能断然地做出有实际差异的推论, 而应提出有关差异的假设检验和进行相应统计分析。 假设检验是统计学中最重要的概念之一,是统计推论的核心,因此正确地理解假设检验 的思想,掌握假设检验的方法与步骤,对统计学的学习和应用具有十分重要的意义。 学习目标 1.理解假设检验的原理 2.掌握假设检验的基本过程 3.了解统计推断的两类错误 4.了解假设检验应注意的问题 第一节 检验假设的基本原理 一、抽样研究与抽样误差 在科学研究中,通常是在研究对象的总体中抽取一定数量的个体作为样本进行研究,即 抽样研究,然后有样本信息(样本统计量)推断总体特征。这个过程称为统计推断。抽样研 究时,由于个体存在差异,通过样本推论总体时会存在一定的误差,这种由抽样造成的样本 均数与总体均数的差异称为抽样误差。 二、两种差异与假设检验 在本章开始问题中提到的心理学研究中遇到的不同组间差异问题,主要有两种情况。一 是组间本身存在着真实差异或实质性差异;另一种则是因为本身并无差异,但是由于抽样的 随机性而出现了差异,即属于抽样误差,这种差异被视为没有实质性的差异。 因此,当两个事物之间出现差异时,可以提出两种假设: 一个假设是:两个总体均数相等,差异仅由抽样误差所致,两个事物之间没有差异。此 称为无效假设(null hypothesis),用 H0 示,即 H0:μ1=μ2。 另一个假设是:两组总体均数不等,其差异不仅仅是由抽样误差所致,两个事物之间存 在着实质性差异。此称为备择假设(alternative hypothesis),用 H1 表示,即 H1:μ1≠μ2

其意义是当无效假设H。被拒绝后,应该接受的假设。例如,要回答本章例5-1提出的认知行为治疗方法是否优于传统支持治疗方法的问题,可以提出下列两种假设:一是两个总体均数不等,即采用认知行为治疗方法的所有抑郁患者的抑郁症状量表分[总体1:N(u1,01与采用传统支持治疗方法的所有抑郁患者的抑郁症状量表分【总体2:N(u2,02)不同,两组有实质性差异,这就是备择假设,记为H,即H:H=20二是相反的假设,即两个总体均数相等,即采用认知行为治疗方法的所有抑郁患者的抑郁症状量表分[总体1:N(μ1,01)]与采用传统支持治疗方法的所有抑郁患者的抑郁症状量表分总体2:N(μ2,α2)相等,两组没有实质性差异,这就是无效假设,记为Ho,即Ho:U,=μ20对于差异究竞属于哪种情况,必须借助一定的统计方法对两种假设的可能性进行分析。假设检验采用小概率反证法的思想。如果统计分析发现误差可能性很小,属小概率事件(在统计学中,通常把概率P0.05),则接受无效假设Ho,拒绝备择假设H,由此推论差异主要来自抽样误差,不存在真实差异,统计上称为差异无统计学意义。对例5-1数据结果进行统计分析,根据计算,得到概率P=0.02。根据小概率原理,可以认为因误差而出现差异的可能性很小,几乎不可能发生,于是就有理由拒绝无效假设H。,反过来接受H,备择假设成立,即认为两种治疗方法效果的差异有统计学意义,由此推论不同治疗方法的效果有实质性差异,得出认知行为治疗方法的效果显著优于传统支持治疗方法的结论。由手在进行差异分析时需要先对事物是否存在差异做出假设,然后再作统计检验,因此称为假设检验,亦称差异的显著性检验(significanttest)。三、双侧检验与单侧检验绝大多数情况下,假设检验关心的是总体间有无差别,不管差别的方向,例如,将备择假设写成H:2,但备择假设H实际上包括>μ和μ2的情况,因此,备择假设可以写为H:μ>μ2,检验水准取单侧概率a(μo.os=l.645)。这种事先明确某一方向的检验,统计上称为单侧检验(one-sidedtest)。单侧检验较双侧检验更容易得到差异有统计学意义的结果。例如,当μ=1.88时,用双侧检验会得到差异没有统计学意义的结果,用单侧检验就会得到差异有统计学意义的结果。但是,单侧检验比双侧检验有更严格的专业要求,一般不轻易使用。所以,两个均数或两个率的比较一般采用双侧检验,除非有充分专业依据,才应用单侧检验。即使采用单侧检验,也应在研究设计阶段做出规定。不能在算得检验统计量后,为了得出“有意义”的结论,把检验水准从μ0.0s/2=1.96的双侧检验改为0.05=1.645的单侧检验。2

2 其意义是当无效假设 H0 被拒绝后,应该接受的假设。 例如,要回答本章例 5-1 提出的认知行为治疗方法是否优于传统支持治疗方法的问题, 可以提出下列两种假设: 一是两个总体均数不等,即采用认知行为治疗方法的所有抑郁患者的抑郁症状量表分 [总体 1:N(μ1,σ1 2 )与采用传统支持治疗方法的所有抑郁患者的抑郁症状量表分 [总体 2: N(μ2,σ2 2 )不同,两组有实质性差异,这就是备择假设,记为 H1,即 H1:H2=μ2。 二是相反的假设,即两个总体均数相等,即采用认知行为治疗方法的所有抑郁患者的抑 郁症状量表分 [总体 1:N(μ1,σ1 2 )]与采用传统支持治疗方法的所有抑郁患者的抑郁症状量 表分 [总体 2: N(μ2,σ2 2 )相等,两组没有实质性差异,这就是无效假设,记为 H0,即 H0: μ1=μ2。 对于差异究竟属于哪种情况,必须借助一定的统计方法对两种假设的可能性进行分析。 假设检验采用小概率反证法的思想。如果统计分析发现误差可能性很小,属小概率事件(在 统计学中,通常把概率 P≤0.05,即 5%,或 P≤0.01,即 1%称为小概率事件,亦称显著性水 平),因此拒绝无效假设 H0,接受备择假设 H1,由此推论差异不属于抽样误差,而是真实的 差异,统计上将此称为差异有统计学意义。相反,若统计分析发现抽样误差可能性很大,不 属小概率事件(P>0.05),则接受无效假设 H0,拒绝备择假设 H1,由此推论差异主要来自抽 样误差,不存在真实差异,统计上称为差异无统计学意义。 对例 5-1 数据结果进行统计分析,根据计算,得到概率 P=0.02。根据小概率原理,可 以认为因误差而出现差异的可能性很小,几乎不可能发生,于是就有理由拒绝无效假设 H0, 反过来接受 H1,备择假设成立,即认为两种治疗方法效果的差异有统计学意义,由此推论不 同治疗方法的效果有实质性差异,得出认知行为治疗方法的效果显著优于传统支持治疗方法 的结论。 由于在进行差异分析时需要先对事物是否存在差异做出假设,然后再作统计检验,因此 称为假设检验,亦称差异的显著性检验(significant test)。 三、双侧检验与单侧检验 绝大多数情况下,假设检验关心的是总体间有无差别,不管差别的方向,例如,将备择 假设写成 H1:μ1≠μ2,但备择假设 H1 实际上包括μ1>μ和μ1<μ两种情况,检验水准取双 侧概率α/2(μ0.05/2=1.96),统计上称为双侧检验(two-sided test)。 如果根据专业知识有充分的理由认为当前研究样本代表的总体均数μ1 只可能大于(或 小于)已知总体均数μ2,例如在例 5-1 中,认知行为治疗组的抑郁症状量表分与传统支持治 疗组不相等,认知行为治疗的效果优于传统支持治疗,根据文献调研和专业知识判断只可能 出现μ1>μ2 的情况,因此,备择假设可以写为 H1:μ1>μ2,检验水准取单侧概率 α(μ0.05=1.645)。这种事先明确某一方向的检验,统计上称为单侧检验(one-sided test)。 单侧检验较双侧检验更容易得到差异有统计学意义的结果。例如,当μ=1.88 时,用双 侧检验会得到差异没有统计学意义的结果,用单侧检验就会得到差异有统计学意义的结果。 但是,单侧检验比双侧检验有更严格的专业要求,一般不轻易使用。所以,两个均数或两个 率的比较一般采用双侧检验,除非有充分专业依据,才应用单侧检验。即使采用单侧检验, 也应在研究设计阶段做出规定。不能在算得检验统计量后,为了得出“有意义”的结论,把 检验水准从μ0.05/2=1.96 的双侧检验改为μ0.05=1.645 的单侧检验

第二节检验假设的基本步骤无论用什么统计方法进行假设检验,实际的操作步骤都是相同的。假设检验应包括以下基本步骤。一、建立检验假设和确定检验水准无效假设:Ho:μ=μ2,两总体均数相等。两个事物之间没有实质性差异,差异仅由抽样误差所致。备择假设:H:μ,=2,两总体均数不等,两个事物之间有实质性差异,其差异不仅仅是由抽样误差所致。检验水准是假设检验时发生第I类错误的概率。用a表示,通常取值0.05或0.01。二、选择检验方法和计算检验统计量我们必须根据资料类型、研究设计方案和统计推断的目的,选择适当的检验方法,不同检验方法有相应不同的检验统计量及计算公式。如完全随机设计的两样本均数比较,可根据资料的特点选用t检验、u检验、F检验等,同时要计算相应的检验统计量。假设检验方法有的时候是以检验统计量来命名的,如t检验、u检验、F检验等。三、确定P值和作出统计推断结论根据计算的统汁量确定P值。常见检验统计量对应的检验界值有u界值、t界值、F界值、X2界值等,检验统计量绝对值对应的检验界值越大,P值越小。P值的习惯表述是:P>0.05称“不显著”(notsignificant):P≤0.05称“显著”(significant);Pa,则接受无效假设Ho,拒绝备择假设Hi,统计结论为“差别没有统计学意义”。统计推断应包括统计结论和专业结论两部分。统计结论只说明有统计学意义或无统计学意义,而不能说明专业上的差异大小。不能理解为P值越小实验(观察)结果本身越有意义。只有将统计结论和专业知识有机地相结合,才能得出恰如其分的专业结论。第三节统计决断的两类错误假设检验采用小概率反证法的思想,根据P值做出的推断结论是一种可能性,因此其结论不可能完全正确,可能发生两类错误,即I型错误和II型错误,见表6-1。3

3 第二节 检验假设的基本步骤 无论用什么统计方法进行假设检验,实际的操作步骤都是相同的。假设检验应包括以下 基本步骤。 一、建立检验假设和确定检验水准 无效假设:H0:μ1=μ2,两总体均数相等。两个事物之间没有实质性差异,差异仅由抽 样误差所致。 备择假设:H1:μ1=μ2,两总体均数不等,两个事物之间有实质性差异,其差异不仅仅 是由抽样误差所致。 检验水准是假设检验时发生第 I 类错误的概率。用α表示,通常取值 0.05 或 0.01。 二、选择检验方法和计算检验统计量 我们必须根据资料类型、研究设计方案和统计推断的目的,选择适当的检验方法,不同 检验方法有相应不同的检验统计量及计算公式。如完全随机设计的两样本均数比较,可根据 资料的特点选用 t 检验、u 检验、F 检验等,同时要计算相应的检验统计量。假设检验方法 有的时候是以检验统计量来命名的,如 t 检验、u 检验、F 检验等。 三、确定 P 值和作出统计推断结论 根据计算的统汁量确定 P 值。常见检验统计量对应的检验界值有 u 界值、t 界值、F 界 值、X2 界值等,检验统计量绝对值对应的检验界值越大,P 值越小。P 值的习惯表述是: P>0.05 称“不显著”(not significant); P≤0.05 称“显著”(significant); P≤0.01 称“非常显著”(highly significant)。 需要注意的是,这里的“显著”(significant)是一个统计学专业术语,如果 P≤α(通 常取值 0.05 或 0.01),则拒绝无效假设 H0,接受备择假设 H1,统计结论为“差别有显著统 计学意义”;如果 P>α,则接受无效假设 H0,拒绝备择假设 H1,统计结论为“差别没有统 计学意义”。 统计推断应包括统计结论和专业结论两部分。统计结论只说明有统计学意义或无统计学 意义,而不能说明专业上的差异大小。不能理解为 P 值越小实验(观察)结果本身越有意义。 只有将统计结论和专业知识有机地相结合,才能得出恰如其分的专业结论。 第三节 统计决断的两类错误 假设检验采用小概率反证法的思想,根据 P 值做出的推断结论是一种可能性,因此其结 论不可能完全正确,可能发生两类错误,即 I 型错误和 II 型错误,见表 6-1

表6-1统计决断的两类错误统计决断客观实际拒绝H接受H。无效假设Ho成立I型错误(a错误)正确决断无效假设H不成立正确决断II型错误(β错误)1.I型错误(typeIerror)。指虚无假设本身是正确的,但由于抽样的随机性而使检验值落入了拒绝虚无假设的区域,致使我们做出拒绝本来真实的虚无假设的错误决断。犯第一类错误的概率有多大呢?够关键就是α值(即显著性水平)的大小。若选择a值为0.05,则意味着平均每百次决策中会有5次犯第一类错误;若选择a值为0.01,则意味着平均每百次决策中会有1次犯第一类错误。由于犯第一类错误的大小与a值一致,故又称这类错误为a错误。2.II型错误(typeIIerror)。亦称β错误,指虚无假设本身不正确,但由于抽样的随机性而使检验值落入了接受虚无假设的区域,致使我们作出了接受本来不成立的虚无假设的错误决断。把本来有差异的事物当成没有差异。3.I型错误和II型错误的关系及控制。我们需要尽可能地控制错误的机率。但I型错误错误和II型错误发生概率存在交错联系,即减小了犯I型错误的风险,必定会增大犯II型错误的风险;同样,减小犯II型错误的风险,又会增大犯I型错误的风险。若要同时减小I型错误和II型错误,唯一的方法就是增加样本含量:若重点减少I型错误,一般取α=0.05;若重点减少II型错误,一般取α=0.10或0.20甚至更高。第四节假设检验应注意的问题1.资料来源必须遵循随机抽样和随机分组的原则,保证样本是从同质总体中随机抽取的,要求资料具有均衡性和可比性,对比组间除了对比的处理因素外,其他能影响结果的于扰因素应力求齐同或基本相近2.选用的统计方法必须符合其适用条件。因研究目的要求不同,设计类型不同。资料性质不同及样本含量大小不等,所选用的检验方法也不相同。3.正确理解差别有统计学意义的涵义。假设检验结论中拒绝H.接受H,习惯上称为“有统计学意义”,不应误解为相差很大,或一定有显著的实用价值;反之,不拒绝H,习惯上称为“无统计学意义”,不应误解为相差不大或无差别。4.假设检验的推断结论不能绝对化。当检验结果拒绝Ho接受Hi,也有犯I类错误的可能性,只是很小罢了。另外,还要强调指出α值,单侧检验或双侧检验及其检验方法等,都是在设计阶段早已事先确定了的,不受样本调查结果或实验结果的影响,更不可在最后统计分析过程中随意改动。5.报告结论时,应写出检验统计量值,检验水准值,若为单侧检验时应特别注明。同时,也不要忘记报告统计量的实际差别和95%可信区间。假设检验只说明有无差别,95%可信区间则能说明差别有多大。4

4 表 6-1 统计决断的两类错误 客观实际 统计决断 拒绝 H0 接受 H0 无效假设 H0 成立 I 型错误(α错误) 正确决断 无效假设 H0 不成立 正确决断 II 型错误(β错误) 1. I 型错误(type I error)。指虚无假设本身是正确的,但由于抽样的随机性而使检 验值落入了拒绝虚无假设的区域,致使我们做出拒绝本来真实的虚无假设的错误决断。 犯第一类错误的概率有多大呢?够 关键就是α值(即显著性水平)的大小。若选择α值 为 0.05,则意味着平均每百次决策中会有 5 次犯第一类错误;若选择α值为 0.01,则意味 着平均每百次决策中会有 1 次犯第一类错误。由于犯第一类错误的大小与α值一致,故又称 这类错误为α错误。 2. II 型错误(type II error)。亦称β错误,指虚无假设本身不正确,但由于抽样的 随机性而使检验值落入了接受虚无假设的区域,致使我们作出了接受本来不成立的虚无假设 的错误决断。把本来有差异的事物当成没有差异。 3. I 型错误和 II 型错误的关系及控制。我们需要尽可能地控制错误的机率。但 I 型错 误错误和 II 型错误发生概率存在交错联系,即减小了犯 I 型错误的风险,必定会增大犯 II 型错误的风险;同样,减小犯 II 型错误的风险,又会增大犯 I 型错误的风险。若要同时减 小 I 型错误和 II 型错误,唯一的方法就是增加样本含量;若重点减少 I 型错误,一般取α =0.05;若重点减少 II 型错误,一般取α=0.10 或 0.20 甚至更高。 第四节 假设检验应注意的问题 1. 资料来源必须遵循随机抽样和随机分组的原则,保证样本是从同质总体中随机抽取 的,要求资料具有均衡性和可比性,对比组间除了对比的处理因素外,其他能影响结果的干 扰因素应力求齐同或基本相近。 2. 选用的统计方法必须符合其适用条件。因研究目的要求不同,设计类型不同。资料 性质不同及样本含量大小不等,所选用的检验方法也不相同。 3. 正确理解差别有统计学意义的涵义。假设检验结论中拒绝 H0 接受 H1,习惯上称为“有 统计学意义”,不应误解为相差很大,或一定有显著的实用价值;反之,不拒绝 H0,习惯上 称为“无统计学意义”,不应误解为相差不大或无差别。 4. 假设检验的推断结论不能绝对化。当检验结果拒绝 H0 接受 H1,也有犯 I 类错误的可 能性,只是很小罢了。另外,还要强调指出α值,单侧检验或双侧检验及其检验方法等,都 是在设计阶段早已事先确定了的,不受样本调查结果或实验结果的影响,更不可在最后统计 分析过程中随意改动。 5. 报告结论时,应写出检验统计量值,检验水准α值,若为单侧检验时应特别注明。 同时,也不要忘记报告统计量的实际差别和 95%可信区间。假设检验只说明有无差别,95% 可信区间则能说明差别有多大

已到末页,全文结束
刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档