《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第七章 不等概率抽样 §1 放回的不等概率抽样 §2 不放回的不等概率抽样

第七章不等概率抽样 到目前为止,我们所讨论的两种抽样方法简单随机抽 样和分层抽样都有一个共同的特点:总体或层中每个个体被 抽中入样的概率都是相同的。对于各单元所处地位几乎 平等”的总体,这种抽样原则既公正又方便。但在许多社 会经济活动中并非所有单元地位相同,这时就需要采用不等 概率抽样方法。 例如,要了解上海地区钢铁企业的景气状况,总体有上 钢 厂、五厂…等等,再加上宝钢。由于宝钢规模 极大,它是否景气对整个上海地区钢铁工业起着至关重要的 作用。而在抽样中将它与其它规模较小的单位处于同等地位 就会既不公正又使抽样推断结果有较大可能发生大的偏差。 这个例子提示我们,若对总体单元进行不等概率抽样,使得 “大”单元入样概率大,“小”单元入样概率小,这里的“ 大”、“小”与我们所关心的调查指标有着密切的关系
到目前为止,我们所讨论的两种抽样方法—简单随机抽 样和分层抽样都有一个共同的特点:总体或层中每个个体被 抽中入样的概率都是相同的。对于各单元所处地位几乎 “ 平等” 的总体,这种抽样原则既公正又方便。但在许多社 会经济活动中并非所有单元地位相同,这时就需要采用不等 概率抽样方法。 第七章 不等概率抽样 例如,要了解上海地区钢铁企业的景气状况,总体有上 钢一厂、三厂、五厂……等等,再加上宝钢。由于宝钢规模 极大,它是否景气对整个上海地区钢铁工业起着至关重要的 作用。而在抽样中将它与其它规模较小的单位处于同等地位 就会既不公正又使抽样推断结果有较大可能发生大的偏差。 这个例子提示我们,若对总体单元进行不等概率抽样,使得 “大”单元入样概率大,“小”单元入样概率小,这里的“ 大” 、 “小”与我们所关心的调查指标有着密切的关系

不等概率抽样又分为有放回与无放回两种情况。我们最 关心也是最重要的情形是抽样容量n固定时,单元入样的概 率(不放回抽样)或每次抽样的概率(有放回抽样)与单元 的大小严格成比例。这种情况下的有放回抽样称为吵抽样 不放回抽样称为兀pS抽样。 §1发回的不等概率抛桿 1、多项抽样、PpS抽样及其实施方法 既然是不等概率抽样,那么就应该在抽样之前给总体中 的每一个单元赋予一定的抽取概率,在放回抽样的每一次抽 取中,设第i个单元入样的概率为Z(0≤Z≤1,i=1,2,…,N 且∑z1=1,按此规定有放回地独立抽取n次,形成所谓 的多项抽样
不等概率抽样又分为有放回与无放回两种情况。我们最 关心也是最重要的情形是抽样容量 n固定时,单元入样的概 率(不放回抽样)或每次抽样的概率(有放回抽样)与单元 的大小严格成比例。这种情况下的有放回抽样称为 抽样 不放回抽样称为 ps 抽样。 pps §1 放回的不等概率抽样 1、多项抽样、 pps 抽样及其实施方法 既然是不等概率抽样,那么就应该在抽样之前给总体中 的每一个单元赋予一定的抽取概率,在放回抽样的每一次抽 取中,设第 个单元入样的概率为 且 ,按此规定有放回地独立抽取 n 次,形成所谓 的多项抽样。 i (0 1, 1,2, , ) Z Z i N i i = 1 1 N Z i i = =

假设第i个单元在n次抽样中被抽中1次,则t1,t2…,tN) 是一个随机向量,其联合分布为: n 1t2 t,↓t!.…t;! ∑4=n( 这是我们熟悉的多项分布,多项抽样其名正出于此。 多项分布(7.1)具有如下性质 E(t:=nZ ur(t1)=nz(1-Z;)i=1,2,…,N ov(t,1)=-mi≠j 倘若单元有一个数值度量其大小,诸如职工人数、工厂产值 商店销售额等,或者感兴趣的调査指标在上一次普査时的数 据也可以作为其单元大小的一种度量。记M为第i个单元的 大小”,并诞0=∑M1
假设第 个单元在 n次抽样中被抽中 次,则 是一个随机向量,其联合分布为: i i t 1 2 ( , , , ) N t t t 这是我们熟悉的多项分布,多项抽样其名正出于此。 1 2 1 2 1 2 ! ! ! ! t t tN N N n Z Z Z t t t 1 N i i t n = = (7.1) 多项分布(7.1)具有如下性质: ( ) ( ) (1 ) 1, 2, , ( , ) i i i i i i j i j E t nZ Var t nZ Z i N Cov t t nZ Z i j = = − = = − 倘若单元有一个数值度量其大小,诸如职工人数、工厂产值 商店销售额等,或者感兴趣的调查指标在上一次普查时的数 据也可以作为其单元大小的一种度量。记 为第 个单元的 “大小”,并记 Mi i 0 1 N Mi i M = =

则可取Z1=MM 此时多项抽样体现了每次抽样时单元的入样概率与单元的大 小成比例,即为pps抽样。 多项抽样是最简单的不等概率抽样,它的实施方法通常 有两种,以pps抽样为例。 (1)代码法 它适合于N不太大的情形。假定所有的M为整数,倘若 在实际中存在M不是整数的话,则可以乘以一个倍数使一切 M为整数(对一般的多项抽样,也总可找到整数M。,使一切 MZ成为整数)。对于具整数M的第i个单元赋予一个与M 相等的代码数,见表7—1
多项抽样是最简单的不等概率抽样,它的实施方法通常 有两种,以pps抽样为例。 则可取 Z M M i i = 0 此时多项抽样体现了每次抽样时单元的入样概率与单元的大 小成比例,即为pps抽样。 (1)代码法 它适合于 N不太大的情形。假定所有的 为整数,倘若 在实际中存在 不是整数的话,则可以乘以一个倍数使一切 为整数(对一般的多项抽样,也总可找到整数 ,使一切 成为整数)。对于具整数 的第 个单元赋予一个与 相等的代码数,见表7—1。 Mi Mi Mi M0 M Z0 i Mi i Mi

表7—1 pps抽样时各单元的代码数 单元单元大小M 代码数 1,22--,M1 2 M M1+1,M1+2,…,M1+M2 N M ∑M+1∑M+2,…∑M+MN=M 每次抽样前,先在整数1,2,…,M0里面随机等可能的选 取一个整数,设为m,若代码m属于第j个单元拥有的代码 数,则第j个单元入样。整个过程重复n次,得到n个单元 入样(当然存在重复的可能性)构成pps样本
单元 i 单元大小 Mi 代码数 1 2 N 1 2 N M M M 1 1 1 0 1 1 1 1, 2, , N N N i i i N i i i M M M M M − − − = = = + + + = 1,2, ,M1 M M M M 1 1 1 2 + + + 1, 2, , 表7—1 pps 抽样时各单元的代码数 每次抽样前,先在整数 里面随机等可能的选 取一个整数,设为m ,若代码 m 属于第 j个单元拥有的代码 数,则第 j个单元入样。整个过程重复 n次,得到 n个单元 入样(当然存在重复的可能性)构成 pps 样本。 1,2, , M0

例7.1设某总体共有N=8个单元,相应M及代码如表所示 iM 30×M 累计 代码 2/5 12 12 1~12 12345678 1/2 15 2713~27 2/3 20 47 28~47 4/3 40 87 48~87 8/5 48 13588~135 3/5 18 153136~153 2/3 20 173154~173 30 203174~203 ∑ Mn=203
例7.1 设某总体共有N=8个单元,相应 Mi 及代码如表所示 1 2 3 4 5 6 7 8 i Mi 2/5 1/2 2/3 4/3 8/5 3/5 2/3 1 30 Mi 12 15 20 40 48 18 20 30 累计 12 27 47 87 135 153 173 203 代码 1~12 13~27 28~47 48~87 88~135 136~153 154~173 174~203 M0 = 203

若取n=3,在1~203中随机有放回地产生3个随机整数,不 妨设为45、89、101,则第3个单元入样一次,第5个单 元入样2次。 (2) Lahiri1(拉希里)方法 当N相当大时,累计的M将很大,给代码法的实施带 来很多不方便。 Lahiri提出下列方法:令M=max{M1} 每次抽取1~N中一个随机整数i及1~M内一个随机整数 m,如果M1≥m,则第i个单元入样;若M1<m,则按前面 步骤重抽(i,m),显然,第个单元的入样与否受到m的影 响,只有M1≥m时它才入样,因此第i个单元入样的概率与 M的大小成正比,此时Z1=M1/M0
若取 n=3,在1~203中随机有放回地产生3个随机整数,不 妨设为45、89、101,则第 3 个单元入样一次,第 5 个单 元入样 2 次。 (2)Lahiri(拉希里) 方法 当 N 相当大时,累计的 将很大,给代码法的实施带 来很多不方便。Lahiri提出下列方法:令 每次抽取 1~N 中一个随机整数 及 1~ 内一个随机整数 ,如果 ,则第 个单元入样;若 ,则按前面 步骤重抽 ,显然,第 个单元的入样与否受到 的影 响,只有 时它才入样,因此第 个单元入样的概率与 的大小成正比,此时 * 1 max{ }i i N M M = i i i i ( , ) i m * M m M m i M m i M m i Mi Z M M i i = 0 M0 m

2、 Hansen- Hurwitz(汉森—赫维茨)估计量 若y1,y2,…,yn是按Z为入样概率的多项抽样而得的样 本数据,它们相应的Z值自然记为 则对总 体总和, Hansen- Hurwitz给出了如下的估计量: Jm≈1 ∑ (7.4) =1 且E(m)=F,即下m是总体总和Y的无偏估计。 ar(m)=∑Z1(-1) (7.6) ur(m)的无偏估计为 v(HH= HH )2(7.7) n(n
2、Hansen-Hurwitz (汉森—赫维茨)估计量 若 是按 为入样概率的多项抽样而得的样 本数据,它们相应的 值自然记为 ,则对总 体总和, Hansen-Hurwitz 给出了如下的估计量: 1 2 , , , n y y y 1 2 , , , n z z z Zi Zi 1 1 n i HH i i y y n z = = (7.4) 且 E y Y ( ) HH = ,即 y HH 是总体总和 Y 的无偏估计。 2 1 1 ( ) ( ) N i HH i i i Y Var y Z Y n Z = = − (7.6) ( ) Var yHH 的无偏估计为 2 1 1 ( ) ( ) ( 1) n i HH HH i i y v y y n n z = = − − (7.7)

§2不发回的不等概率抛样 上一节讲述了有放回不等概率抽样,无论从实施上还是 从估计计算以及精度估计都显得十分方便。但是,一个单元 被抽中两次以上总会使样本的代表性扩折拍,从而引起抽样 误差的增加。因此,实际调查工作者一般倾向于使用不放回 形式。 最简单的不放回不等概率抽样方式自然会想到逐一抽样 这在第一次抽样时不会发生问题,但在抽第二个样本时面临 的情况与有放回时大不相同,余下的(N-1)个单元以什 么样的概率参与第二次抽样就是个问题;再在抽第三个样本 时又面临新问题,如此下去,一是抽样实施的复杂,二是估 计量及其方差计算的复杂,因此,在本节仅讨论n固定,尤 其是n=2时的情形。同时,我们只对使总体中每个单元的入 样概率严格地与其“大小”成比例感兴趣,这就是所谓S 抽样
§2 不放回的不等概率抽样 上一节讲述了有放回不等概率抽样,无论从实施上还是 从估计计算以及精度估计都显得十分方便。但是,一个单元 被抽中两次以上总会使样本的代表性打折扣,从而引起抽样 误差的增加。因此,实际调查工作者一般倾向于使用不放回 形式。 最简单的不放回不等概率抽样方式自然会想到逐一抽样 这在第一次抽样时不会发生问题,但在抽第二个样本时面临 的情况与有放回时大不相同,余下的 ( N-1 ) 个单元以什 么样的概率参与第二次抽样就是个问题;再在抽第三个样本 时又面临新问题,如此下去,一是抽样实施的复杂,二是估 计量及其方差计算的复杂,因此,在本节仅讨论 n固定,尤 其是n=2时的情形。同时,我们只对使总体中每个单元的入 样概率严格地与其“大小”成比例感兴趣,这就是所谓的 抽样。 ps

1、包含概率x,zn 不放回不等概率抽样中,总体中每个单元被包含到样本 的概率,即入样概率,p(是个重要的概念,而且任意 两个单元包含到样本中去的概=P(,j)也是个重要的 概念可以想象,估计量的方差等计算舍字;有着密切 的关魇然表示第讠个单元在n个样本中出现的可能性, 那么所有N个单元在样本中出现的可能性之和自然等于n, 这就悬}的一个众所周知的性质: ∑兀=n (7.8) 我们所考虑的严格pS抽样,既然兀1与M2成比例,若 n固定的话,显然有: 丌=m1=n·n,M=∑M(9) 0 i=1
1、包含概率 , i ij 不放回不等概率抽样中,总体中每个单元被包含到样本 的概率,即入样概率 是个重要的概念,而且任意 两个单元包含到样本中去的概率 也是个重要的 概念可以想象,估计量的方差等计算会与 有着密切 的关系 ( ) i = p i ( , ) ij = p i j, i ij 既然 表示第 个单元在 n个样本中出现的可能性, 那么所有 N个单元在样本中出现的可能性之和自然等于 n, 这就是 的一个众所周知的性质: i i { } i 我们所考虑的严格 抽样,既然 与 成比例,若 n固定的话,显然有: ps i Mi 1 N i i n = = (7.8) 0 0 1 , N i i i i i M nZ n M M M = = = = (7.9)
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第六章 二重抽样 §3 二重抽样的比估计与回归估计 §4 二重抽样样本量的最优分配.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第六章 二重抽样 §1 二重抽样简述 §2 二重分层抽样.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第九章 二阶与多阶抽样 §1 初级单元大小相等的二阶抽样 §2 初级单元大小不等的二阶抽样 §3 三阶及多阶抽样.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第八章 整群抽样 §1 群大小相等的整群抽样 §2 群大小不等的整群抽样.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第二章 概率与概率分布 §7 若干数学准备.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第二章 概率与概率分布 §3 问卷设计(一).ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第二章 概率与概率分布 §5 调查员素质 §6 数据处理与调查总结报告.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第二章 概率与概率分布 §1 概率的概念.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第一章 绪论 §4 抽样调查的设计.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第一章 绪论 §2 抽样调查中的几个基本概念 §3 抽样调查的组织形式及调查方法.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第一章 绪论 §1 抽样调查的概念和作用.ppt
- 蚌埠医学院:《多元统计分析》重点一.doc
- 蚌埠医学院:《多元统计分析》重点二.doc
- 蚌埠医学院:《多元统计分析》第四讲 多元统计分析.doc
- 蚌埠医学院:《多元统计分析》第三章 聚类分析.ppt
- 蚌埠医学院:《多元统计分析》(英文版) Chapter 9 Cluster analysis.ppt
- 蚌埠医学院:《多元统计分析》第六章 试验设计与方差分析.doc
- 蚌埠医学院:《多元统计分析》第六讲 方差分析.doc
- 蚌埠医学院:《多元统计分析》第五讲 数据的收集.doc
- 蚌埠医学院:《多元统计分析》第三章 数据的描述.doc
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第三章 简单随机抽样 §1 简单随机抽样及实施方法 §2 总体平均数与总和的估计 §3 估计量的方差及其估计.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第三章 简单随机抽样(3-4)百分数的估针及其误差 §4 百分数的估计及其误差 §5 样本容量n的确定.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第十二章 非抽样误差 §1 抽样方案及抽样框引起的非抽样误差 §2 无回答现象 §3 计量误差 §4 敏感性问题的调查.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第十章 系统抽样 §1 系统抽样的若干习性 §2 估计量与方差 §3 方差与总体单元排列顺序的关系 §4 具有线性趋势的总体的抽样方法改进.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第四章 分层抽样 §1 分层抽样及估计量 §2 比例分配及最优分配.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第四章 分层抽样 §3 样本总容量n的确定 §4 分层的若干技术问题.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第五章 比估计与回归估计 §1 比估计及其性质 §2 分层抽样中的比估计.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第五章 比估计与回归估计 §3 数值例子 §4 回归估计量.ppt
- 《社会科学统计》(英文版) Lecture 5 T-Test (W).pdf
- 《社会科学统计》(英文版) Lecture 8 Simple Linear Regression.pdf
- 《抽样调查》课程教学资源(PPT课件讲稿)第一章 抽样调查概述.ppt
- 《抽样调查》课程教学资源(PPT课件讲稿)第十章 非抽样误差及其控制.ppt
- 《抽样调查》课程教学资源(PPT课件讲稿)第二章 抽样调查基本原理.ppt
- 《抽样调查》课程教学资源(PPT课件讲稿)第三章 简单随机抽样.ppt
- 《抽样调查》课程教学资源(PPT课件讲稿)第四章 分层抽样.ppt
- 《抽样调查》课程教学资源(PPT课件讲稿)第五章 比估计与回归估计.ppt
- 《抽样调查》课程教学资源(PPT课件讲稿)第六章 整群抽样.ppt
- 《抽样调查》课程教学资源(PPT课件讲稿)第七章 等距抽样.ppt
- 《抽样调查》课程教学资源(PPT课件讲稿)第八章 多阶抽样.ppt
- 《抽样调查》课程教学资源(PPT课件讲稿)第九章 二重抽样.ppt