《心理统计学》课程授课教案(讲稿)第五章 参数估计

第五章参数估计问题通常情况下,某群体某种特征的总体参数是未知的,而且研究者也不可能将该群体的所有个体都作为研究对象进行研究,从而获得总体参数。研究者一般采取随机抽样的方法,通过对从该总体中所抽取的样本进行研究,将样本的参数作为总体参数的估计值。因此,参数估计(parameterestimation)是指如何从样本结果推论总体状况的统计学方法。在样本研究过程中,即使研究者严格地遵守了随机抽样的原则,所得样本的统计量与总体参数也会存在一定程度的差异,这种差异就叫做抽样误差。本章学习目标1.了解抽样与抽样误差的概念2.了解均数的标准误的概念及计算方法3.了解点估计和区间估计的概念及计算方法5.了解率的抽样误差与可信区间估计5.应用SPSS进行参数估计第一节均数的抽样误差一、抽样与抽样误差由于总体中各个体间存在差异,在抽样的过程中由于偶然的因素可能会多抽到一些数值较大或较小的样本,从而产生抽样误差。这种误差在抽样研究中是不可避免的,但只要样本是随机抽取的,抽样误差也就是随机的,我们就可以用统计学的方法来计算或估计它的大小。二、均数的标准误在抽样研究中,用样本的均数(X)来估计总体的均数(u),样本均数的标准误(SEx)是衡量抽样误差大小的重要指标。当总体方差(α)已知时,可用公式(5-1)来表示均数的标准误。(x-μ)?nSC-(SE-)JnVn(5-1)从上式中可以发现,标准误与总体标准差()成正比,与样本量的平方根成反比。因此在标准差不变的情况下,通过增加样本量可以减小均数的标准误,从而提高对总体均数的估计精度。在实际研究工作中,总体方差或标准差通常是未知的,我们只能用样本标准差(S)作为总体标准差的估计值。然而数理统计学已经证明,样本标准差常较总体标准差偏小,要用1
1 第五章 参数估计 问题 通常情况下,某群体某种特征的总体参数是未知的,而且研究者也不可能将该群体的所 有个体都作为研究对象进行研究,从而获得总体参数。研究者一般采取随机抽样的方法,通 过对从该总体中所抽取的样本进行研究,将样本的参数作为总体参数的估计值。因此,参数 估计(parameter estimation)是指如何从样本结果推论总体状况的统计学方法。在样本研 究过程中,即使研究者严格地遵守了随机抽样的原则,所得样本的统计量与总体参数也会存 在一定程度的差异,这种差异就叫做抽样误差。 本章学习目标 1. 了解抽样与抽样误差的概念 2. 了解均数的标准误的概念及计算方法 3. 了解点估计和区间估计的概念及计算方法 5. 了解率的抽样误差与可信区间估计 5. 应用 SPSS 进行参数估计 第一节 均数的抽样误差 一、抽样与抽样误差 由于总体中各个体间存在差异,在抽样的过程中由于偶然的因素可能会多抽到一些数值 较大或较小的样本,从而产生抽样误差。这种误差在抽样研究中是不可避免的,但只要样本 是随机抽取的,抽样误差也就是随机的,我们就可以用统计学的方法来计算或估计它的大小。 二、均数的标准误 在抽样研究中,用样本的均数( X )来估计总体的均数(µ),样本均数的标准误( X SE ) 是衡量抽样误差大小的重要指标。当总体方差( 2 )已知时,可用公式(5-1)来表示均数 的标准误。 n n X n SE X X − = = 2 ( ) ( ) (5-1) 从上式中可以发现,标准误与总体标准差( )成正比,与样本量的平方根成反比。 因此在标准差不变的情况下,通过增加样本量可以减小均数的标准误,从而提高对总体均数 的估计精度。 在实际研究工作中,总体方差或标准差通常是未知的,我们只能用样本标准差(S)作 为总体标准差的估计值。然而数理统计学已经证明,样本标准差常较总体标准差偏小,要用

Sn-作为总体标准差的估计量才是无偏的。因此,当总体标准差未知时,应当用公式5-2来计算均数的标准误。E(x-x)Z(X-x)1sS-VMn-1SEx="In-iVnVnVn-1(52)例5-1:100名学生在某人格测验中神经质维度平均得分为55.87,标准差为10.35,问其标准误是多少?s10.35=1.04SEx=n-1V100-1第二节总体参数估计总体参数估计包括点估计和区间估计。例5-1中100名学生神经质维度平均得分55.87可作为其总体均数的点估计值,一、点估计在参数估计中直接用样本的统计量(数轴上的某一个点)作为总体参数的估计值就叫做点估计,例如用样本均数(X)作为总体均数的估计值(μ),用样本方差(S")作为总体方差(α")的估计值,用样本相关系数(r)作为总体相关系数的估计值(P)。但是作为一个良好的估计量必须具备一定的特性。1.无偏性用样本统计量估计总体参数会存在一定的误差,有的会偏大,有的偏小,但是多个样本统计量偏差的平均数如果为0,这个统计量就是无偏估计量,否则是有偏估计量。作为总体参数的良好估计值应当具备无偏性,即Z(X-l)=0。根据数理统计原理,当随机抽样的样本量足够大时,样本统计量作为总体参数的估计值时可视为无偏估计量。2.一致性当样本容量无限增大时,估计值将越来越接近总体参数,即当N→0时X→μ, S?→a?3.有效性当总体参数的无偏估计有多个统计量的时候,应当分析各个统计量的变异大小,无偏估计变异小者有效性高,变异大者则有效性低。例如样本均数(X)、中位数(Md)和众数(Mo)等都是无偏估计,但只有均数变异最小,即它的方差最小,故均数作为总体参数的估计值最好,这也是统计分析时中位数和众数不常使用的原因。5.充分性指一个容量为n的样本统计量,是否充分地反映了所有n个数据所反映总体的信息。从前面所学的知识我们知道,计算样本均数时所有的数据都必须参与,故X的充分性高;而计算样本的中位数或众数时只有部分数据参与,所以它们的充分性较低。同理,2
2 Sn-1 作为总体标准差的估计量才是无偏的。因此,当总体标准差未知时,应当用公式 5-2 来 计算均数的标准误。 1 1 ( ) 1 ( ) 2 2 1 − = − − = − − = = − n S n n X X n n X X n S SE n X (5-2) 例 5-1:100 名学生在某人格测验中神经质维度平均得分为 55.87,标准差为 10.35,问 其标准误是多少? 1.04 100 1 10.35 1 − = − = n S SEX 第二节 总体参数估计 总体参数估计包括点估计和区间估计。例 5-1 中 100 名学生神经质维度平均得分 55.87 可作为其总体均数的点估计值, 一、点估计 在参数估计中直接用样本的统计量(数轴上的某一个点)作为总体参数的估计值就叫做 点估计,例如用样本均数( X )作为总体均数的估计值(µ),用样本方差(S 2)作为总体 方差(σ 2)的估计值,用样本相关系数(r)作为总体相关系数的估计值(P)。但是作为一 个良好的估计量必须具备一定的特性。 1. 无偏性 用样本统计量估计总体参数会存在一定的误差,有的会偏大,有的偏小, 但是多个样本统计量偏差的平均数如果为 0,这个统计量就是无偏估计量,否则是有偏估计 量。作为总体参数的良好估计值应当具备无偏性,即 (X − ) = 0 。根据数理统计原理, 当随机抽样的样本量足够大时,样本统计量作为总体参数的估计值时可视为无偏估计量。 2. 一致性 当样本容量无限增大时,估计值将越来越接近总体参数,即当 N → 时 X → , 2 2 S → 。 3. 有效性 当总体参数的无偏估计有多个统计量的时候,应当分析各个统计量的变异 大小,无偏估计变异小者有效性高,变异大者则有效性低。例如样本均数( X )、中位数(Md) 和众数(Mo)等都是无偏估计,但只有均数变异最小,即它的方差最小,故均数作为总体参 数 µ 的估计值最好,这也是统计分析时中位数和众数不常使用的原因。 5. 充分性 指一个容量为 n 的样本统计量,是否充分地反映了所有 n 个数据所反映总 体的信息。从前面所学的知识我们知道,计算样本均数时所有的数据都必须参与,故 X 的 充分性高;而计算样本的中位数或众数时只有部分数据参与,所以它们的充分性较低。同理

Sn-,比AD2(平均差)和Q(四分差)更具有充分性。一个好的点估计,应具备上述4个特征。但由于抽样误差的客观存在,我们只能推测当样本量无限增大时,X靠近μ,具体n要大到什么程度,均数能“靠近”到什么程度?我们有多大的把握来判断总体参数估计值准确性?这些都是点估计不能解决的问题,区间估计可以弥补这个缺点。二、区间估计区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它虽不能指出总体参数的具体位置,但能说明未知参数落入某一区间的概率有多大。1.可信区间与显著性水平可信区间(confidenceinterval)是指在某一可信度时,总体参数估计值所落的区间范围。可信度又称显著性水平(significantlevel),是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示。例如在正态分布的情况下,.95可信区间是指总体参数落在该区间内,估计正确的概率(1-α)为95%,而出现错误的概率为5%(α=0.5)。由此可见:.95的可信区间=.05显著水平的可信区间,或.05可信度的可信区间。.99的可信区间=.01显著水平的可信区间,或.01可信度的可信区间。显著性水平在假设检验中,还指拒绝无效假设时可能犯错误的概率水平。2.可信区间与可信度的关系人们在解决实际问题时,通常希望估计值的范围小一点,而成功的概率大一点。也就是说希望估计值尽可能精确,犯错误的可能性又尽可能少。然而在样本量一定的情况下,二者往往不可能兼得。因为要提高估计正确的概率,就势必要扩大可信区间,如果要使估计完全正确(α=0),则可信区间会很宽,等于没作估计了。反之要求估计值非常精确,可信区间很窄,那么正确估计的概率势必降低。所以在实际工作中应当综合考虑,设置一个合适的可信区间和显著性水平。统计分析中一般规定:正确估计的概率(也即可信水平)为.95或.99,则显著性水平为.05或.01,其依据是5%或1%发生的可能性属于小概率事件,而小概率事件在一次抽样中是不可能出现的这个原理。三、总体平均数的估计根据已知数据的分布情况,总体均数的估计方法有所不同。(一)总体方差已知时的总体均数估计已知总体方差(α)呈正态分布,或者总体方差虽不是正态分布但样本容量大于30的时,这两种情况下可用正态估计法来估计总体均数的可信区间。例5-2已知某分数总体分布为正态,且标准差为10。从该总体中随机抽取两个样本,n=50、X=50,nz=20、X2=50,问总体参数的0.95和0.99可信区间是多少?
3 Sn-1 比 AD2(平均差)和 Q 2(四分差)更具有充分性。 一个好的点估计,应具备上述 4 个特征。但由于抽样误差的客观存在,我们只能推测当 样本量无限增大时, X 靠近 µ,具体 n 要大到什么程度,均数能“靠近”到什么程度?我 们有多大的把握来判断总体参数估计值准确性?这些都是点估计不能解决的问题,区间估计 可以弥补这个缺点。 二、区间估计 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它虽不能指出总体参 数的具体位置,但能说明未知参数落入某一区间的概率有多大。 1. 可信区间与显著性水平 可信区间(confidence interval)是指在某一可信度时, 总体参数估计值所落的区间范围。可信度又称显著性水平(significant level),是指估计 总体参数落在某一区间时,可能犯错误的概率,用符号 表示。 例如在正态分布的情况下,.95 可信区间是指总体参数落在该区间内,估计正确的概率 (1-α)为 95%,而出现错误的概率为 5%(α=0.5)。由此可见: .95 的可信区间=.05 显著水平的可信区间,或.05 可信度的可信区间。 .99 的可信区间=.01 显著水平的可信区间,或.01 可信度的可信区间。 显著性水平在假设检验中,还指拒绝无效假设时可能犯错误的概率水平。 2. 可信区间与可信度的关系 人们在解决实际问题时,通常希望估计值的范围小一点, 而成功的概率大一点。也就是说希望估计值尽可能精确,犯错误的可能性又尽可能少。然而 在样本量一定的情况下,二者往往不可能兼得。因为要提高估计正确的概率,就势必要扩大 可信区间,如果要使估计完全正确(α=0),则可信区间会很宽,等于没作估计了。反之要 求估计值非常精确,可信区间很窄,那么正确估计的概率势必降低。所以在实际工作中应当 综合考虑,设置一个合适的可信区间和显著性水平。统计分析中一般规定:正确估计的概率 (也即可信水平)为.95 或.99,则显著性水平为.05 或.01,其依据是 5%或 1%发生的可能性 属于小概率事件,而小概率事件在一次抽样中是不可能出现的这个原理。 三、总体平均数的估计 根据已知数据的分布情况,总体均数的估计方法有所不同。 (一)总体方差已知时的总体均数估计 已知总体方差(σ2)呈正态分布,或者总体方差虽不是正态分布但样本容量大于 30 的 时,这两种情况下可用正态估计法来估计总体均数的可信区间。 例 5-2 已知某分数总体分布为正态,且标准差为 10。从该总体中随机抽取两个样本, n1 = 50、X1 = 50,n2 = 20 、X2 = 50,问总体参数μ的 0.95 和 0.99 可信区间是多少?

1.计算方法(1)分析条件、选用方法:已知总体分布为正态,可采用正态估计法求可信区间。(2)求样本均数的标准误:用公式5-1分别计算两个样本的标准误610SEx,=-=1.41Vn/509=10= 2.24SEx=%= 720(3)求可信区间公式:X±ZSEx(5-3)查正态分布表,P=0.95时,Z=1.96;P=0.99时,Z=0.28。样本—:0.95的可信区间μ=50±1.96x1.41=50±2.76=57.25~52.760.99的可信区间μ=50±2.58×1.41=50±3.64=56.36~53.64样本二:0.95的可信区间μ=50±1.96×2.24=50±4.39=55.61~55.390.99的可信区间μ=50±2.58×2.24=50±5.78=55.22~55.782.结果解释以第一个样本平均数进行估计时,总体均数μ落在57.25至52.76之间的概率为95%,估计错误的概率为5%;落在56.36至53.64之间的概率为99%,估计错误的概率为1%。以第二个样本均数对总体均数进行估计的方法也相同。从以上结果中可以看出,可信区间范围的大小除了与可信度(正确估计概率)大小有关外,与样本标准误(SEx)的大小有关,SEx越大,说明误差大,同样可信度水平时可信区间范围就越宽,反之相反。另外我们比较样本一和样本二,尽管它们的平均数都为50,但是样本容量不同,样本一的SEx小于样本二,其可信区间范围就相对较窄。因此,加大样本容量是提高估计值精确性的方法之一。(二)总体方差未知时的总体均数估计由于在实际工作中通常不知道总体方差,这时可用样本的无偏方差(Sn-1)作为总体方差的估计值。当总体方差未知时,样本平均数的分布为t分布,因此可用t分布估计法来对总体均数的可信区间进行估计。并且无论样本的数量≥30还是<30,都可以用使用。例5-3已知某班10位学生的某科平均成绩为81分,标准差(Sn-)为9.5,求该年级总体平均成绩95%和99%的可信区间(假设总体为正态)。1.计算方法(1)分析条件、选用方法:已知总体分布为正态,但不知总体方差,可采用t分布估计法求总体均数的可信区间。(2)求样本均数的标准误:用公式5-2计算样本的标准误Sl=9.55=3.0SEx==TO(3)求可信区间(用公式5-3)查t值表,当f=10—1=9时:(0)0.0/2=2.26,(09)00/2=3.254
4 1. 计算方法 (1)分析条件、选用方法:已知总体分布为正态,可采用正态估计法求可信区间。 (2)求样本均数的标准误:用公式 5-1 分别计算两个样本的标准误 1.41 50 10 1 1 = = = n SEX 2.24 20 10 2 2 = = = n SEX (3)求可信区间 公式: X ZSEX (5-3) 查正态分布表,P=0.95 时,Z=1.96;P=0.99 时,Z=0.28。 样本一:0.95 的可信区间 = 50 1.961.41 = 50 2.76 = 57.25~52.76 0.99 的可信区间 = 50 2.581.41= 50 3.64 = 56.36~53.64 样本二:0.95 的可信区间 = 50 1.96 2.24 = 50 4.39 = 55.61~55.39 0.99 的可信区间 = 50 2.58 2.24 = 50 5.78 = 55.22~55.78 2. 结果解释 以第一个样本平均数进行估计时,总体均数 µ 落在 57.25 至 52.76 之间 的概率为 95%,估计错误的概率为 5%;落在 56.36 至 53.64 之间的概率为 99%,估计错误的 概率为 1%。以第二个样本均数对总体均数进行估计的方法也相同。 从以上结果中可以看出,可信区间范围的大小除了与可信度(正确估计概率)大小有关 外,与样本标准误(SEx)的大小有关,SEx 越大,说明误差大,同样可信度水平时可信区 间范围就越宽,反之相反。另外我们比较样本一和样本二,尽管它们的平均数都为 50,但 是样本容量不同,样本一的 SEx 小于样本二,其可信区间范围就相对较窄。因此,加大样本 容量是提高估计值精确性的方法之一。 (二)总体方差未知时的总体均数估计 由于在实际工作中通常不知道总体方差,这时可用样本的无偏方差(S 2 n-1)作为总体方 差的估计值。当总体方差未知时,样本平均数的分布为 t 分布,因此可用 t 分布估计法来对 总体均数的可信区间进行估计。并且无论样本的数量≥30 还是<30,都可以用使用。 例 5-3 已知某班 10 位学生的某科平均成绩为 81 分,标准差(Sn-1)为 9.5,求该年级 总体平均成绩 95%和 99%的可信区间(假设总体为正态)。 1. 计算方法 (1)分析条件、选用方法:已知总体分布为正态,但不知总体方差,可采用 t 分布估 计法求总体均数的可信区间。 (2)求样本均数的标准误:用公式 5-2 计算样本的标准误 3.0 10 1 9.5 = = = − n S SE n X (3)求可信区间(用公式 5-3) 查 t 值表,当 df =10-1=9 时; t (9)0.05/ 2 = 2.26 , t (9)0.01/ 2 = 3.25

0.95的可信区间μ=81±2.26×3.0=81±6.78=75.22~87.780.99的可信区间μ=81±3.25×3.0=81±9.75=71.25~90.752.结果解释以样本平均数进行估计时,总体均数μ落在75.22至87.78之间的概率为95%,估计错误的概率为5%;落在71.25至90.75之间的概率为99%,估计错误的概率为1%。四、总体标准差和方差的估计(一)总体标准差的区间估计与总体平均数的估计方法相似,当样本容量n>30时,利用或样本S进行估计,当总体未知时,可用样本S-1进行估计。首先,也需要计算标准差分布的标准误SEs(或os),其公式为:aOs=J2n(5-4)例5-5已知某班52位学生的某科平均成绩为78.5分,标准差(Ss-1)为10,求该样本总体标准差95%的可信区间。1.计算方法(1)分析条件、选用方法:此题n>30,样本标准差的分布可视为近似正态分布,Z0.05/2=1.96。(2)求样本标准差的标准误:用公式5-5计算样本的标准误10a10=0.98Os=V2n2×52210.2(3)求可信区间:95%的可信区间为C= Sn- ±1.96os=10±1.96×0.98= 8.08~11.922.结果解释以样本标准差进行估计时,总体标准差落在8.08至11.92之间的概率为95%,估计错误的概率为5%。(二)总体方差的区间估计根据分布:Ex-_(n-snsa2a2a(5-5)从正态分布的总体中随机抽取一个样本,其样本方差与总体方差比值的分布应为x分5
5 0.95 的可信区间 = 81 2.263.0 = 81 6.78 = 75.22~87.78 0.99 的可信区间 = 81 3.253.0 = 81 9.75 = 71.25~90.75 2. 结果解释 以样本平均数进行估计时,总体均数 落在 75.22 至 87.78 之间的概率 为 95%,估计错误的概率为 5%;落在 71.25 至 90.75 之间的概率为 99%,估计错误的概率为 1%。 四、总体标准差和方差的估计 (一)总体标准差的区间估计 与总体平均数 的估计方法相似,当样本容量 n>30 时,利用 或样本 S 进行估计, 当总体 未知时,可用样本 Sn−1 进行估计。首先,也需要计算标准差分布的标准误 ( ) SES 或 S ,其公式为: n S 2 = (5-4) 例 5-5 已知某班 52 位学生的某科平均成绩为 78.5 分,标准差( Sn−1 )为 10,求该样 本总体标准差 95%的可信区间。 1.计算方法 (1)分析条件、选用方法:此题 n>30,样本标准差的分布可视为近似正态分布, Z0.05/2=1.96。 (2)求样本标准差的标准误:用公式 5-5 计算样本的标准误 0.98 10.2 10 2 52 10 2 = = = = n S (3)求可信区间:95%的可信区间为 = Sn−1 1.96 S =10 1.960.98 = 8.08 ~11.92 2. 结果解释 以样本标准差进行估计时,总体标准差 落在 8.08 至 11.92 之间的概 率为 95%,估计错误的概率为 5%。 (二)总体方差的区间估计 根据 2 分布: 2 2 2 2 1 2 2 2 ( ) ( 1) X X n Sn nS = − = − = − (5-5) 从正态分布的总体中随机抽取一个样本,其样本方差与总体方差比值的分布应为 X 2 分

布,这样可以通过直接查X2表来确定比值的可信区间。再进一步用下式来确定总体方差的可信区间。(n-1)sa-1(n-1)Sz-xa/230,样本方差的分布可视为近似正态分布。(2)查X*表确定a/2与zica/2;df=52-1=51,求总体方差95%的可信区间时Xos/2应取α.025(因×表的概率是从一侧计算的,故应查α/2的概率)。查x表得到a12为x.025=71.4,而x-α/2为x75=32.4(3)计算总体方差95%的可信区间:代入公式5-6(n-1)St-(n- 1)Si-I(52 - 1)102(52 - 1)102xan2<oXian271.432.4<a<得71. 5<*<157. 52.结果解释以样本标准差进行估计时,总体方差落在71.5至157.5之间的概率为95%,估计错误的概率为5%。五、总体相关系数的估计本书只介绍常用方法Fisher的Z函数分布法,其原理是将样本相关系数先转换为-yZr值(因一yZr的样本分布近似正态分布),并用一Zr值进行可信区间估计,然后再将其还原为相关系数。该方法的优点是既不必考虑样本容量,也无需顾忌总体相关系数P。例5-5某研究(N=100)发现中学生智商(IQ)与语文成绩的相关为0.5,问总体相关系数95%的可信区间是多少?计算方法(1)将r转换为1Zr函数。查Fisher函数转换表(附表?),当r=0.5时,zrZ,0.525。(2)用公式5-7求~1Zr的标准误。1SEz.Vn-3(5-7)6
6 布,这样可以通过直接查 X 2 表来确定比值的可信区间。再进一步用下式来确定总体方差的 可信区间。 2 / 2 2 1 ( 1) n − Sn− < 2 < 2 1 / 2 2 1 ( 1) − n − Sn− (5-6) 例 5-5:求例 5-5 样本总体方差为 95%的可信区间。 1. 计算方法 (1)分析条件、选用方法:此题 n>30,样本方差的分布可视为近似正态分布。 (2)查 X 2 表确定 2 / 2 与 2 1− / 2 :df = 52 −1 =51,求总体方差 95%的可信区间时 2 .05/ 2 应取 2 .025 (因 X 2 表的概率是从一侧计算的,故应查 / 2 的概率)。查 X 2 表得到 2 / 2 为 71.4 2 .025 = ,而 2 1− / 2 为 32.4 2 .975 = 。 (3)计算总体方差 95%的可信区间:代入公式 5-6 2 / 2 2 1 ( 1) n − Sn− < 2 < 2 1 / 2 2 1 ( 1) − n − Sn− 得 71.4 (52 1)102 − < 2 < 32.4 (52 1)102 − 71.5< 2 <157.5 2. 结果解释 以样本标准差进行估计时,总体方差σ2 落在 71.5 至 157.5 之间的概率 为 95%,估计错误的概率为 5%。 五、总体相关系数的估计 本书只介绍常用方法 Fisher 的 Z 函数分布法,其原理是将样本相关系数先转换为 Z y Zr 值(因 Z y Zr 的样本分布近似正态分布),并用 Z y Zr 值进行可信区间估计,然后再将其还原 为相关系数。该方法的优点是既不必考虑样本容量,也无需顾忌总体相关系数 P。 例 5-5 某研究(N=100)发现中学生智商(IQ)与语文成绩的相关为 0.5,问总体相关 系数 95%的可信区间是多少? 计算方法 (1)将 r 转换为 Z Zr 函数。查 Fisher 函数转换表(附表?),当 r=0.5 时,Zr Z = 0.525。 (2)用公式 5-7 求 Z Zr 的标准误。 3 1 − = n SEZr (5-7)

11SEz,= J100-3"9.84=0.10(3)求zr的可信区间:Z=Z,±ZSEz,=0.4±1.96×0.1=0.204~0.5962rZr再转换为r:查附表?,P=0.20~0.535(5)将结果解释结果表明,中学生智商与语文成绩相关系数落在0.20至0.535之间的概率为95%,估计错误的概率为5%。第三节率的抽样误差与可信区间估计一、比率的样本分布比率的分布是二项分布。假设具有某种特征的事件发生比率(概率)为p,则不具有这种特征事件发生的可能性为1一p即q。从这种二项分布总体中每次抽取数量为n的样本,p=xn(x为成功的次数)=1-p,当np≥5(或ng≥5)以上时样可计算实得的比率本比率P的分布为渐近正态分布。率的均数"p=p(5-7)pqd=SEVn率的标准误p或(5-8a)p=4n,是总体比率的点估计值,如果不知总体p、q时,可用P和9来代替样本比率因此公式5-8a又可写为:Pdpn(5-8b)二、比率的区间估计根据样本含量的大小,比率的可信区间估计方法有所不同。1.当np≥5时,可用公式5-9来计算比率的可信区间。7
7 0.10 9.84 1 100 3 1 = = − = Zr SE (3)求 Z Zr 的可信区间: = = 0.4 1.96 0.1 = 0.204 ~ 0.596 Zr Z Zr ZSE (5)将 Z Zr 再转换为 r:查附表?, = 0.20 ~ 0.535 结果解释 结果表明,中学生智商与语文成绩相关系数落在 0.20 至 0.535 之间的概率为 95%,估 计错误的概率为 5%。 第三节 率的抽样误差与可信区间估计 一、比率的样本分布 比率的分布是二项分布。假设具有某种特征的事件发生比率(概率)为 p,则不具有这 种特征事件发生的可能性为 1-p 即 q。从这种二项分布总体中每次抽取数量为 n 的样本, 可计算实得的比率 n x p ˆ = ( x 为成功的次数) q ˆ =1− p ˆ ,当 np 5 (或 nq 5 )以上时样 本比率 p ˆ 的分布为渐近正态分布。 率的均数 p = p (5-7) 率的标准误 SEp 或 n pq p = (5-8a) 样本比率 n x p ˆ = ,是总体比率的点估计值,如果不知总体 p、q 时,可用 p ˆ 和 q ˆ 来代替, 因此公式 5-8a 又可写为: n pq p ˆ ˆ = (5-8b) 二、比率的区间估计 根据样本含量的大小,比率的可信区间估计方法有所不同。 1. 当 np ˆ 5 时,可用公式 5-9 来计算比率的可信区间

pqμp=p=p±Za/2n(5-9)例5-6从某团体中随机抽取100人进行某种测试,70人通过了测试,30人没有通过,问总体中能通过该测试的比率应为多少?计算方法(1)分析条件、选用方法:P=70/100=0.7,9=1-0.7=0.3,np=10×0.7=7>5,此题np≥5,可用公式5-9进行计算可信区间。(2)设通过人数比率的可信水平为0.95,Zα/2=1.96p.q0.7×0.3=0.046op=V1V100n(3)(5)P的95%可信区间为:P=0.7±1.95×0.046=0.611~0.789结果解释以样本通过率进行估计时,总体通过比率落在0.611至0.789之间的概率为95%,估计错误的概率为5%。2.当np≤5,或p非常小时,二项分布不接近正态,此时不能用公式5-9计算,可通过直接查二项分布上下可信界限表(附表?)获得比率的可信区间。附表?为α=0.05可信度的二项分布表,附表?则是α=0.01可信度的二项分布表。表的左列为实计数,即具有某特征的实际数目,最上一行为样本量。应用时根据样本量和实际数目交叉点便可查到两个数字,这两个数字分别为相应水平(α=0.05或α=0.01)时比率可信区间的上、下限百分数。例5-7随机抽取高一学生20人,其数学期末考试不及格者2人,问高一学生期末数学考试不及格人数的95%可信区间。计算方法(1)分析条件、选用方法:p=2/20=0.1,np=20×0.1=2<5,不能用公式5-9计算可信区间,可用直接查表法。(2)查附表?样本量为20这一列与实际数X=2这一行的交叉点,查得1、30两个数字,1为可信区间下限1%,30为可信区间上限30%。结果解释以样本通过率进行估计时,高一年级期末数学考试不及格比率落在0.01至0.30之间的概率为95%,估计错误的概率为5%。8
8 n pq p = p = p Z • / 2 ˆ (5-9) 例 5-6 从某团体中随机抽取 100 人进行某种测试,70 人通过了测试,30 人没有通过, 问总体中能通过该测试的比率应为多少? 计算方法 (1)分析条件、选用方法: p ˆ =70/100=0.7, q ˆ =1-0.7=0.3, np ˆ =10×0.7=7>5,此题 np ˆ 5 ,可用公式 5-9 进行计算可信区间。 (2)设通过人数比率的可信水平为 0.95, Z / 2 =1.96。 (3) 0.046 100 ˆ ˆ 0.7 0.3 = = • = n p q p (5) p 的 95%可信区间为: p = 0.7 1.95 0.046 = 0.611 ~ 0.789 结果解释 以样本通过率进行估计时,总体通过比率落在 0.611 至 0.789 之间的概率为 95%,估计 错误的概率为 5%。 2. 当 np 5 ,或 p 非常小时,二项分布不接近正态,此时不能用公式 5-9 计算,可通 过直接查二项分布上下可信界限表(附表?)获得比率的可信区间。 附表?为 = 0.05 可信度的二项分布表,附表?则是 = 0.01 可信度的二项分布表。 表的左列为实计数,即具有某特征的实际数目,最上一行为样本量。应用时根据样本量和实 际数目交叉点便可查到两个数字,这两个数字分别为相应水平( = 0.05 或 = 0.01 )时 比率可信区间的上、下限百分数。 例 5-7 随机抽取高一学生 20 人,其数学期末考试不及格者 2 人,问高一学生期末数 学考试不及格人数的 95%可信区间。 计算方法 (1)分析条件、选用方法: p ˆ = = 2 / 20 0.1,np ˆ =20×0.1=2<5,不能用公式 5-9 计算可信区间,可用直接查表法。 (2)查附表?样本量为 20 这一列与实际数 X=2 这一行的交叉点,查得 1、30 两个数字, 1 为可信区间下限 1%,30 为可信区间上限 30%。 结果解释 以样本通过率进行估计时,高一年级期末数学考试不及格比率落在 0.01 至 0.30 之间的 概率为 95%,估计错误的概率为 5%
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 《心理统计学》课程授课教案(讲稿)第三章 计量资料的描述统计.doc
- 《心理统计学》课程授课教案(讲稿)第二章 统计表和统计图.doc
- 《心理统计学》课程授课教案(讲稿)第一章 绪论.doc
- 《心理统计学》课程教学大钢 Psychological Statistics.doc
- 《生理心理学》课程教学资源(PPT课件)第10章 学习与记忆的生理心理.ppt
- 《生理心理学》课程教学资源(PPT课件)第8章 睡眠与觉醒(睡眠的生理心理).ppt
- 《生理心理学》课程教学资源(PPT课件)第7章 运动控制的生理心理.ppt
- 《生理心理学》课程教学资源(PPT课件)第6章 感知觉生理心理(二).ppt
- 《生理心理学》课程教学资源(PPT课件)第5章 感知觉生理心理(一).ppt
- 《生理心理学》课程教学资源(PPT课件)第4章 脑的发育与可塑性.ppt
- 《生理心理学》课程教学资源(PPT课件)第3章 生理心理学的解剖基础.ppt
- 《生理心理学》课程教学资源(PPT课件)第2章 神经元的电活动与信息交流.ppt
- 《生理心理学》课程教学资源(PPT课件)第1章 绪论(生理心理学概论).ppt
- 《生理心理学》课程教学资源(PPT课件)第9章 注意的心理生理.ppt
- 《生理心理学》课程授课教案(讲稿)第一章 生理心理学概论.doc
- 《生理心理学》课程授课教案(讲稿)第二章 神经元的电活动与信息交流.doc
- 《生理心理学》课程授课教案(讲稿)第六章 感知觉生理心理(二).doc
- 《生理心理学》课程授课教案(讲稿)第三章 心理活动的神经解剖学基础.doc
- 《生理心理学》课程授课教案(讲稿)第四章 脑的发育与可塑性.doc
- 《生理心理学》课程授课教案(讲稿)第五章 感知觉生理心理(一).doc
- 《心理统计学》课程授课教案(讲稿)第四章 相关分析.doc
- 《心理统计学》课程授课教案(讲稿)第六章 假设检验.doc
- 《心理统计学》课程授课教案(讲稿)第七章 两组均数差别比较的t检验.doc
- 《心理统计学》课程授课教案(讲稿)第九章 多因素方差分析.doc
- 《心理统计学》课程授课教案(讲稿)第八章 单因素方查分析.doc
- 《心理统计学》课程授课教案(讲稿)第十章 卡方检验.doc
- 《心理统计学》课程授课教案(讲稿)第十一章 秩转换的非参数检.doc
- 《心理统计学》课程教学资源(PPT课件)05 相关关系(质与量的相关、品质相关).ppt
- 《心理统计学》课程教学资源(PPT课件)04 差异量数.ppt
- 《心理统计学》课程教学资源(PPT课件)07 参数估计.ppt
- 《心理统计学》课程教学资源(PPT课件)06 概率分布(样本分布).ppt
- 《心理统计学》课程教学资源(PPT课件)03 集中量数 Measure of central tendency.ppt
- 《心理统计学》课程教学资源(PPT课件)06 概率分布(概率的基本概念、正态分布、二项分布).ppt
- 《心理统计学》课程教学资源(PPT课件)01 绪论(华北理工大学:杨绍清).ppt
- 《心理统计学》课程教学资源(PPT课件)02 统计图表(次数分布表的制作、次数分布图的制作).ppt
- 《心理统计学》课程教学资源(PPT课件)08 假设检验 8.2 平均数的显著性检验.ppt
- 《心理统计学》课程教学资源(PPT课件)08 假设检验 8.3 平均数差异的显著性检验 8.4 方差的差异检验 8.5 相关系数的显著性检验 8.6 比率的显著性检验.ppt
- 《心理统计学》课程教学资源(PPT课件)08 假设检验 8.1 假设检验的原理.ppt
- 《心理统计学》课程教学资源(PPT课件)09 方差分析-1/2.ppt
- 《心理统计学》课程教学资源(PPT课件)09 方差分析-2/2.ppt