中国高校课件下载中心 》 教学资源 》 大学文库

《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第六章 二重抽样 §3 二重抽样的比估计与回归估计 §4 二重抽样样本量的最优分配

文档信息
资源类别:文库
文档格式:PPT
文档页数:20
文件大小:660.5KB
团购合买:点击进入团购
内容简介
二重比估计与二重回归估计的思想与二重分层估计的思 想相类似。比估计与回归估计需要事先知道辅助变量X的平 均数或总和。如果事先并不掌握辅助变量的平均数或者总和 的信息,但辅助变量的观察要比调查的指标Y容易得多,那 么就可以使用二重比估计或者二重回归估计。
刷新页面文档预览

§3二重抽样的比估升与回归估 重比估计与二重回归估计的思想与二重分层估计的思 想相类似。比估计与回归估计需要事先知道辅助变量X的平 均数或总和。如東事先并不掌握辅助变量的平荺数或者总和 的信息,但辅助变量的观察要比调查的指标Y容易得多,那 么就可以使用二重比估计或者二重回归估计。第一重抽样只 观察辅助变量的值,获得均值或者总和的估计,然后在第二 重抽样时应用比估计或者回归估计。为简单起见,本节仅讨 论对总体平均数的估计。 1、二重比估计方法 由于涉及到两个指标,一个是主调查指标Y,另一个是 辅助变量X,用数据对表示一个单元(x,y)。先从总体中抽 取一个大样本,记作: {(x1,y1),(x2y2),…(xn,yn)

二重比估计与二重回归估计的思想与二重分层估计的思 想相类似。比估计与回归估计需要事先知道辅助变量 X的平 均数或总和。如果事先并不掌握辅助变量的平均数或者总和 的信息,但辅助变量的观察要比调查的指标 Y容易得多,那 么就可以使用二重比估计或者二重回归估计。第一重抽样只 观察辅助变量的值,获得均值或者总和的估计,然后在第二 重抽样时应用比估计或者回归估计。为简单起见,本节仅讨 论对总体平均数的估计。 §3 二重抽样的比估计与回归估计 1、二重比估计方法 由于涉及到两个指标,一个是主调查指标Y,另一个是 辅助变量X,用数据对表示一个单元 。先从总体中抽 取一个大样本,记作: ( , ) x y 1 1 2 2 {( , ),( , ), ,( , )} x y x y x y n n  

n是样本容量,仅对辅助变量x进行观察,计算样本均值 x=2 它是总体辅助变量平均数X的无偏估计。 把该样本作为总体进行第二重简单随机抽样,样本容量 n<n,得样本: {(x21,y21),(x2y2),…,(x2n2y2n) 第一个下标表示第二重抽样。分别计算辅助变量与主调查指 标的样本均值 x=∑ 卩=∑ 6.7) n j=1 构造总体主调查指标平均数Y的比估计量:

n 是样本容量,仅对辅助变量X进行观察,计算样本均值 1 1 n i i x x n  =  =   它是总体辅助变量平均数 X 的无偏估计。 把该样本作为总体进行第二重简单随机抽样,样本容量 n n   ,得样本: 21 21 22 22 2 2 {( , ),( , ), ,( , )} x y x y x y n n 第一个下标表示第二重抽样。分别计算辅助变量与主调查指 标的样本均值 构造总体主调查指标平均数 Y 的比估计量: 2 1 1 n j j x x n = =  2 1 1 n j j y y n = =  (6.7)

RD 兰· = (68) 这里用记号R表示y/x,根据第五章第一节的讨论,我们 知道当n足够大时,R近似地等R=y/x,即R是R的 渐近无偏估计。因此 yRD≈x=y (6.9) 而由第三章可知,是总体平均数y的无偏估计。故yRD 是总体平均数Y的渐近无偏估计 二重比估计yRD的方差vr(y)的估计为: 2 ()=2(11 n(n/(R22-2Rsgx)(610)

这里用记号 表示 ,根据第五章第一节的讨论,我们 知道当 n 足够大时, 近似地等于 ,即 是 的 渐近无偏估计。因此 R ˆ R ˆ R ˆ R y x R y x =   而由第三章可知, 是总体平均数 的无偏估计。故, 是总体平均数 的渐近无偏估计。 y Y Y RD y 二重比估计 yRD 的方差 Var y( ) RD 的估计为: ˆ RD y y x R x x =     (6.8) RD y y x y x    =    (6.9) 2 1 1 ˆ 2 2 ˆ ( ) ( 2 ) y RD x yx s v y R s Rs n n n   = + − −     (6.10)

这里,S2,s32和Sx分别为第二重样本关于主调查指标、辅助变 量的方差以及它们的协方差,即 n ∑0y)=n12(x-x) 1)=1 S= ∑(2-)(x2-x)( n 例62某县共有200个村,现要估计去年全县平均每村交售肉 猪的头数。已知肉猪的交售头数与生猪年终存栏数之间有较高 的相关性,而存栏头数的资料容易取得。采用二重比估计的方 法,先抽取80个村作为第一重样本,得年终平均每村的生猪存 栏数为1080头。然后在这80个村中又选了13个村作为第二重样 本,分别统计了年终的存栏数和交售头数,资料见下表

这里, 和 分别为第二重样本关于主调查指标、辅助变 量的方差以及它们的协方差,即 2 2 , y x s s yx s 2 2 2 1 1 ( ) 1 n y j j s y y n = = − −  2 2 2 1 1 ( ) 1 n x j j s x x n = = − −  2 2 1 1 ( )( ) 1 n yx j j j s y y x x n = = − − −  (6.11) 例6.2 某县共有200个村,现要估计去年全县平均每村交售肉 猪的头数。已知肉猪的交售头数与生猪年终存栏数之间有较高 的相关性,而存栏头数的资料容易取得。采用二重比估计的方 法,先抽取80个村作为第一重样本,得年终平均每村的生猪存 栏数为1080头。然后在这80个村中又选了13个村作为第二重样 本,分别统计了年终的存栏数和交售头数,资料见下表

试估计该县去年全年平均每村交售肉猪的头数,并计算其标 准差。 村年终生猪存栏头数(x)全年交售肉猪头数(2) 550 610 720 780 234567 1500 1600 1020 1030 620 600 980 1050 928 977 8 1200 1440 1350 1570 10 1750 2210 670 980 12 729 865 13 1530 1710

1 2 3 4 5 6 7 8 9 10 11 12 13 550 720 1500 1020 620 980 928 1200 1350 1750 670 729 1530 610 780 1600 1030 600 1050 977 1440 1570 2210 980 865 1710 村i 2 ( )j 年终生猪存栏头数 x 2 ( )j 全年交售肉猪头数 y 试估计该县去年全年平均每村交售肉猪的头数,并计算其标 准差

解:根据表中数据计算可得 =1186.31x=1042.08R=y/x=11384 ∑(2-y)2=231543 13-1f S 13 13-1 ∑ (x/~x)2=153876 j=1 S=13-12(y-D(x1-x)=1838 而n=80,x=1080,n=13 于是计算可得每村平均交售肉猪头数的估计为 a=Rx=1.1384×1080≈1230(头)

解: 根据表中数据计算可得 y = 1186.31 x = 1042.08 ˆ R y x = = 1.1384 13 2 2 2 1 1 ( ) 231543 13 1 y j j s y y = = − = −  13 2 2 2 1 1 ( ) 153876 13 1 x j j s x x = = − = −  13 2 2 1 1 ( )( ) 183578 13 1 yx j j j s y y x x = = − − = −  而 n x n   = = = 80 , 1080 , 13 于是计算可得每村平均交售肉猪头数的估计为 ˆ 1.1384 1080 1230 RD y R x =  =    (头)

二重比估计yAD的方差vr(y)的估计为: RD =→+ (R SK-2RS =—×231543+ (1.13842×153876-2×11384×183578) 13 1380 =373109 于是交售头数平均数估计的标准差为、v(m2)=61.08(头) 2、二重回归估计方法 沿用前一小节的符号,仅讨论B为样本回归系数的情形。 利用第二重样本估计回归系数B,即

二重比估计 yRD 的方差 Var y( ) RD 的估计为: 2 1 1 ˆ 2 2 ˆ ( ) ( 2 ) y RD x yx s v y R s Rs n n n   = + − −     1 1 1 2 231543 (1.1384 153876 2 1.1384 183578) 13 13 80   =  + −   −       = 3731.09 于是交售头数平均数估计的标准差为 ( ) 61.08 (头) RD v y = 2、二重回归估计方法 沿用前一小节的符号,仅讨论 为样本回归系数的情形。 利用第二重样本估计回归系数 ,即  

∑(2)-)(x2/-x) 1 ∑xx j=1 对总体平均数Y的二重抽样的回归估计量为: JirD=y+B(x'x) (6.12) x为第一重样本辅助变量的平均值,x与卫分别是第二重样 本辅助变量与主调査指标的平均值。 yhD是总体平均数Y的渐近无偏估计,其方差的估计为: irD)S Sy. T S (6.13) n nn

对总体平均数 Y 的二重抽样的回归估计量为: 2 2 1 2 2 1 ( )( ) ( ) n j j j n j j y y x x x x  = = − − = −   ( ) lrD y y x x = + −   (6.12) 为第一重样本辅助变量的平均值, 与 分别是第二重样 本辅助变量与主调查指标的平均值。 x x y ylrD 是总体平均数 Y 的渐近无偏估计,其方差的估计为: 2 1 1 2 2 ( ) y lrD y s v y r s n n n   = + −     (6.13)

r是辅助变量X与主调查指标Y之间的相关系数的估计,即 ∑(y2/-)(x2y-x) 6.14 ∑(x2-x)2·∑(y2y-)2 j=1 例63在前例中,改用二重回归估计来估计该县去年全年每 村肉猪平均交售头数,并计算估计的标准差。 解:根据前例数据计算可得 ∑( y2i )(x. -x) Syx 183578 B =1.193 ∑(x2-x)2 153876 j=1

r 是辅助变量X与主调查指标Y之间的相关系数的估计,即 2 2 1 2 2 2 2 1 1 ( )( ) ( ) ( ) n j j j n n j j j j y y x x r x x y y = = = − − = −  −    (6.14) 例6.3 在前例中,改用二重回归估计来估计该县去年全年每 村肉猪平均交售头数,并计算估计的标准差。 解: 根据前例数据计算可得 2 2 1 2 2 2 1 ( )( ) 183578 1.193 153876 ( ) n j j j yx n x j j y y x x s s x x  = = − − = = = = −  

∑(y2-j)x2-x) ∑(xy-x j=1 (对一对2=2(, 153876 =B=1193 =0.97256 231543 J 于是该县去年全年每村肉猪平均交售头数Y的二重回归估计 Vird=y+B(x'x) =1186.31+1.193×(1080-104208)≈1232(头)

2 2 1 2 2 2 2 1 1 ( )( ) ( ) ( ) n j j j n n j j j j y y x x r x x y y = = = − − = −  −    2 2 1 2 2 1 ( ) ( ) n j j n j j x x y y  = = − = −   x y s s =  153876 1.193 0.97256 231543 = = ( ) lrD y y x x = + −   = +  −  1186.31 1.193 (1080 1042.08) 1232 (头) 于是该县去年全年每村肉猪平均交售头数 Y 的二重回归估计

共20页,试读已结束,阅读完整版请下载
刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档