中国高校课件下载中心 》 教学资源 》 大学文库

《医学统计学》课程教学资源(文献资料)非参数bootstrap方法

文档信息
资源类别:文库
文档格式:PPTX
文档页数:13
文件大小:178.3KB
团购合买:点击进入团购
内容简介
《医学统计学》课程教学资源(文献资料)非参数bootstrap方法
刷新页面文档预览

非参数bootstrap方法 1,背景及概念 2,估计量的标准误差的BOQTSTRAP估计 3,BOOTSTAP置信区间 4,其他相关内容

1、背景及概念 2、估计量的标准误差的BOOTSTRAP估计 3、BOOTSTAP置信区间 4、其他相关内容 非参数bootstrap方法

1、背景及概念 1.1 1979年,美国Stanford大学统计学教授Efron提出了 一种新的增广样本系统的方法,为解决小样本的评估问题 提供了新的思路,这种方法就是Bootstrap方法,也叫自助 法.统计学中“Bootstrap”法是指用原样本自身的数据抽样 得出新的样本及统计量,它根据给定的原始样本复制观测 信息,不需要进行分布假设或增加新的样本信息,可对总 体的分布特性进行统计推断,属于非参数统计方法·

1、背景及概念 1.1 1979 年,美国 Stanford 大学统计学教授 Efron 提出了 一种新的增广样本系统的方法,为解决小样本的评估问题 提供了新的思路,这种方法就是 Bootstrap 方法,也叫自助 法. 统计学中“Bootstrap”法是指用原样本自身的数据抽样 得出新的样本及统计量,它根据给定的原始样本复制观测 信息,不需要进行分布假设或增加新的样本信息,可对总 体的分布特性进行统计推断,属于非参数统计方法.

1.2 原理 Bootstrap方法的基本思想是:在有n个原始数据 的范围内做有放回的抽样,样本容量仍为(也可 以不为),每个观测对象被抽到的概率相等,即 为1/n.它是将样本看作整体,将从样本中抽样 得到的子样本看作样本,把所得到的这个子样本 称为Bootstrap样本,于是,每得到一个bootstrap 样本就计算一下统计量的观测值,重复N次,就 得到该统计量的N个观测值(观测值也可以称为 Bootstrap统计量),做观测值的直方图,就可以 得到Bootstrap统计量的经验分布,然后进行统 计推断

1.2 原理  Bootstrap 方法的基本思想是: 在有 n 个原始数据 的范围内做有放回的抽样,样本容量仍为 n( 也可 以不为 n) ,每个观测对象被抽到的概率相等,即 为1/n. 它是将样本看作整体,将从样本中抽样 得到的子样本看作样本,把所得到的这个子样本 称为 Bootstrap 样本,于是,每得到一个bootstrap 样本就计算一下统计量的观测值,重复 N 次,就 得到该统计量的 N 个观测值( 观测值也可以称为 Bootstrap 统计量) ,做观测值的直方图,就可以 得到 Bootstrap 统计量的经验分布,然后进行统 计推断.

2、估计量的标准误差的BOQTSTRAP估计 在估计总体未知参数日时,人们不但给出日的 估计量日,还需指出估计的精度,通常用日 的标准差VD(日)来度量。 ×VD(日)的bootstrap估计求解步骤是: 1)自原始数据样本X=(x1,X2,.,n)按 放回抽样的方法,抽取容量为的样本= (X1*,X2*, xn*)(称为oootstrap样本)

2、估计量的标准误差的BOOTSTRAP估计  在估计总体未知参数 θ 时,人们不但给出 θ 的 估计量θ ^,还需指出估计的精度,通常用θ ^ 的标准差√ D( θ ^ )来度量。  √ D( θ ^ )的 bootstrap 估计求解步骤是:  1)自原始数据样本 x=(x1,x2,.,xn)按 放回抽样的方法,抽取容量为n 的样本 x= (x1*,x2*,.,xn*)(称为bootstrap 样本)

2)相继地、独立地抽取B个容量为n的 b0 otstrap样本,X*i=(X1*i,x2*i,.,Xn*i ),i=1,2,B。对于第i个bootstrap样本, 计算0^*=日(X1*i,x2*i,.,Xn*i),日 *称为日的第i个bootstrap估计

 2)相继地、独立地抽取B 个容量为 n 的 bootstrap 样本,x*i=(x1*i,x2*i,.,xn*i ),i=1,2,.,B。对于第 i 个bootstrap 样本, 计算θ ^ *= θ ^ (x1*i,x2*i,.,xn*i), θ ^ *称为 θ 的第 i 个 bootstrap 估计

×3)计算VD(日) ×将原始样本大小自小到大排序,9.5, 10.2,12.0,18.2,21.1;其中位数为12,相继地、 独立地在上述五个数据中,按放回抽样的方法 取样,取B=1000,得到pootstrap样本如下:

 3)计算 √ D( θ ^ )  将原始样本大小自小到大排序,9.5 , 10.2,12.0,18.2,21.1;其中位数为12,相继地、 独立地在上述五个数据中,按放回抽样的方法 取样,取B=1000,得到bootstrap样本如下:

×样本1: 9.5,18.2,12.0,10.2,18.2 ×样本2:21.1,18.2,12.0,9.5,10.2 ×样本3:21.2,10.2,10.2,10.2,12.0,10.2 ×样本4:18.2,12.0,9.5,18.2,10.2 ×样本5:21.1,12.0,18.2,12.0,18.2 ×样本6:10.2,10.2,9.5,18.2,10.2 ×样本7:9.5,21.1,12.0,10.2,12.0 ×样本8:10.2,18.2,10.2,21.1,21.1

 样本1: 9.5,18.2,12.0,10.2,18.2  样本2: 21.1,18.2,12.0,9.5,10.2  样本3: 21.2,10.2,10.2,10.2,12.0,10.2  样本4: 18.2,12.0,9.5,18.2,10.2  样本5: 21.1,12.0,18.2,12.0,18.2  样本6: 10.2,10.2,9.5,18.2,10.2  样本7: 9.5,21.1,12.0,10.2,12.0  样本8: 10.2,18.2,10.2,21.1,21.1

01^*=12.0;02^*=12.0;03^*=10.2 ×日4^*=12.0;65^*=18.2;66*=10.2 ×67^*=12.0;日8^*=18.2. ×VD(0)=3.4579

 θ1 ^ *=12.0;θ2 ^ *=12.0;θ3 ^ *=10.2  θ4 ^ *=12.0;θ5 ^ *= 18.2;θ6 ^ *=10.2  θ7 ^ *=12.0;θ8 ^ *=18.2.  √ D( θ ^ )=3.4579

3、BOOTSTAP置信区间 例:有30窝仔猪出生时各窝猪的存活只数为 9,8,10,12,11,12,7,9,7,7 8,9,7,9,9,10,9,9,9,12 10,10,9,13,11,13,9 以样本均值作总体均值山的估计,以样本标 准差$作为总体标准差σ的估计,按分位数法求 u以及o的置信水平为0.90的oootstrap置信区间. 这里B=10000

3、BOOTSTAP置信区间 例:有30窝仔猪出生时各窝猪的存活只数为 9, 8 ,10 ,12 ,11 ,12 ,7 , 9,7 ,7 , 8 ,9 ,7 ,9 ,9 ,10 ,9 ,9 ,9 ,12 , 10 ,10 ,9 ,13 ,11 ,13 ,9 以样本均值x作总体均值的估计,以样本标 准差s作为总体标准差的估计,按分位数法求 以及的置信水平为0.90的bootstrap置信区间. 这里B=10000

×1,抽样,计算oootstrap.样本统计量x* ×2,将pootstrap样本统计量自小到大排序, ×3,求k1,k2 k1=500,k2=9500 X*w=9.03,X*0 =10.038 x则u的一个置信水平为90%的otta地置信区间 为 ×(X*w,X*920)=(9.03,10.038)

 1,抽样,计算bootstrap样本统计量x* i  2,将bootstrap样本统计量自小到大排序,  3,求k1,k2 k1=500,k2=9500  x* 500 =9.03; x* 9500 =10.038  则的一个置信水平为90%的bootstrap置信区间 为  ( x* 500 , x* 9500 )=(9.03,10.038)

共13页,试读已结束,阅读完整版请下载
刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档