《医学统计学》课程教学资源(文献资料)非参数bootstrap方法及其MATLAB实现

第34卷第2期 丽水学院学报 2012年4月 Vo1.34N0.2 JOURNAL OF LISHUI UNIVERSITY Apr.2012 非参数bootstrap方法及其MATLAB实现 吴庆平,林素仙,黄飞 丽水学院理学院,浙江丽水323000) 摘要:介绍非参数bootstra即方法的实现步骤,并通过具体实例,利用MATLAB强大的编程和计 算功能实现了非参数boots过rap方法。 关键词:Bootstrap抽样:标准误差:均方误差:置信区间 doi:10.3969.issn.1008-6749.2012.02.002 中图分类号:0212.7 文献标志码:A 文章编号:1008-6749(2012)02-0014-05 Non-parametric Bootstrap Method and its Realiztion in MATLAB W u Q ingping,L in Suxian,H uang Fei (Cokge ofScence,LnversitLiZhe ag 3000.Chna Abstract:This paper introduced the operating steps of non-parametric bootstrap method,which is realized through specific examples,and by using the powerful programming and calculating function of MATLAB. Key words:Bootstrap sam pling:standard eron:m ean square error:confidence in terval 0引言 非参数bootstrap方法最早由Eom提出,是近代统计中一种用于数据处理的重要实用方法,它无 需对总体分布类型作任何的假设,就可利用boos即样本对总体F进行统计推断,而且适用于小样本, 因而应用广泛-。该方法计算量非常大,手工计算几乎不可能完成,本文利用数值软件MATLAB的强 大计算和编程功能,通过具体实例说明了非参数bootstra即方法的MATLAB实现。首先对文中调用的 M ATLAB函数作一简要介绍:unidmd(N,m,)的功能为产生mxn的随机矩阵,矩阵元素为1-N中的随 机数:sot(A)的功能为对A中元素自小到大排列,其中A是mxl或者1xn矩阵:mean(⊙和s()将求取 以向量x=xx2,x.】为样本数据的样本均值和样本标准差。 1估计量标准误差的bootstrap估计 在估计总体未知参数日时,人们不但给出日的估计量,还需指出估计的精度,通常用的标准差 VD(©来度量。VD(©的bootstrap估计求解步骤是: 收稿日期:2011-10-10 基金项日:浙江省教有厅科研项日(Y200805480 作者简介:吴庆平,男,浙江丽水人,助教,顾士。 1994-2012 China Academic Journal Eleetronie Publishing House.All rights reserved.http://www.enki.net
0 引言 非参数 bootstrap 方法最早由 Efron[1]提出,是近代统计中一种用于数据处理的重要实用方法,它无 需对总体分布类型作任何的假设,就可利用 bootstrap 样本对总体 F 进行统计推断,而且适用于小样本, 因而应用广泛[2-7]。该方法计算量非常大,手工计算几乎不可能完成,本文利用数值软件 MATLAB 的强 大计算和编程功能,通过具体实例说明了非参数 bootstrap 方法的 MATLAB 实现。首先对文中调用的 MATLAB 函数作一简要介绍:unidrnd(N,m,n)的功能为产生 m×n 的随机矩阵,矩阵元素为 1-N 中的随 机数;sort(A)的功能为对 A 中元素自小到大排列,其中 A 是 n×1 或者 1×n 矩阵;mean(x)和 std(x)将求取 以向量 x= x1,x2.,x n T 为样本数据的样本均值和样本标准差。 1 估计量标准误差的 bootstrap 估计 在估计总体未知参数 θ 时,人们不但给出 θ 的估计量θ 赞,还需指出估计的精度,通常用θ 赞的标准差 D(θ 姨 赞 )来度量。 D(θ 姨 赞 )的 bootstrap 估计求解步骤[8]是: 非参数 bootstrap 方法及其 MATLAB 实现 吴庆平,林素仙,黄 飞 ( 丽水学院 理学院,浙江 丽水 323000) 摘要:介绍非参数 bootstrap 方法的实现步骤,并通过具体实例,利用 MATLAB 强大的编程和计 算功能实现了非参数 bootstrap 方法。 关键词:Bootstrap 抽样;标准误差;均方误差;置信区间 doi:10.3969/j.issn.1008-6749.2012.02.002 中图分类号:O212.7 文献标志码:A 文章编号:1008-6749(2012)02-0014-05 Non- parametric Bootstrap Method and its Realiztion in MATLAB Wu Qingping,Lin Suxian,Huang Fei (College of Science,Lishui University,Lishui Zhejiang 323000,China) Abstract:This paper introduced the operating steps of non -parametric bootstrap method,which is realized through specific examples,and by using the powerful programming and calculating function of MATLAB. Key wor ds:Bootstrap sampling;standard error;mean square error;confidence interval 收稿日期:2011-10-10 基金项目:浙江省教育厅科研项目(Y200805484) 作者简介:吴庆平,男,浙江丽水人,助教,硕士。 丽 水 学 院 学 报 JOURNAL OF LISHUI UNIVERSITY 第 34 卷第 2 期 Vo1.34 No.2 2012 年 4 月 Apr.2012 丽 水 学 院 学 报 JOURNAL OF LISHUI UNIVERSITY 第 34 卷第 2 期 Vo1.34 No.2 2012 年 4 月 Apr.2012

第2期 吴庆平,林素仙,黄飞:非参数bootst即方法及其M ATLAB实现 15 D自原始数据样本=(x,x2,x)按放回抽样的方法,抽取容量为n的样本=Gx,x,x。)(称为 bootstrap样本)。 2)相继独立地抽取B个容量为n的bosp样木,x=6G.,a1,2,B。对于第i个 boo5tap样本,计算0=0x,x,x,0称为6的第i个bootstrap估计。 0计算VD面-V∑日-0)',其中6-合。 下面通过实例说明标准误差bootstrap估计的MATLAB实现。 例1网某种基金的年回报率是具有分布函数F的连续型随机变量,F未知,F的中位数日是未知参 数。现有以下数据(%0:18.2,9.5,12.0,21.1,10.2 以样本中位数作为总体中位数日的估计。试求中位数估计的标准误差的bootstrap估计。 编写求取B个总体中位数0的bootstrap估计的函数,命名为functionl.m文件,程序如下: for =1B,S=unidmd(5,5,1):M=sort(X (S)):A (=M (3)end 在命令窗口中输入X=[18.2,9.5,12.0,21.1,10.2]:A=anction1(X,B):等sA),其中B是可变量,在 实际中应取B≥1000,依次取B=1000,2000,3000,4000,5000,运行上述过程即可求出1VD(为3.7179, 3.7818,3.7325,3.6884,3.7203。 2估计量的均方误差及偏差的bootstrap估计 是总体未知参数的估计量,的均方误差定义为MSE(=E(-],它度量了估计与未知参数0 偏离的平均值的大小。一个好的估计应该有较小的均方误差。关于0的偏差定义为=£(-,偏差是估 计量无偏性的度量,当是的0无偏估计时b=0。均方误差及偏差的boos即估计的求解步骤与标准误差 类似,只需将步骤)中计算0替换为计算0-0'和间-0,将步骤D相应替换为SE@=官∑日-0。 b=合∑间-0。下面通过实例说明估计量的均方误差及偏差的b0o心即估计的MATLAB实现。 例2国设金属元素铂的升华热是具有分布函数F的连续型随机变量,F的中位数0是未知参数,现 测得以下数据(以kcaloli: 136.3,136.6,135.8,135.4,134.7,135.0,134.1,143.3,147.8 148.8,134.8,135.2,134.9,149.5,141.2,135.4,134.8,135.8 135.0,133.7,134.4,134.9,134.8,134.5,134.3,135.2 以样本中位数CD作为总体中位数6的估计。试求均方误差MSEE[(在-)的bootsr即估计。 根据样本容易求得总体中位数0的估计为135.l,编写求取B个(-2的函数nction2,其中是 第i个bootstrap样本的中位数,程序如下: 1994-2012 China Academic Journal Electronie Publishing House.All rights reserved.http://www.enki.net
1)自原始数据样本 x=(x1,x2,.,xn )按放回抽样的方法,抽取容量为 n 的样本 x=(x1 * ,x2 * ,.,xn * )(称为 bootstrap 样本)。 2)相继独立地抽取 B 个容量为 n 的 bootstrap 样本,x *i =(x1 *i ,x2 *i ,.,xn *i ),i=1,2,.,B。对于第 i 个 bootstrap 样本,计算θ 赞 1 * =θ 赞 (x1 *i ,x2 *i ,.,xn *i ),θ 赞 i * 称为 θ 的第 i 个 bootstrap 估计。 3)计算 D(θ 姨 赞 )= 1 B-1 B Σi=1 (θ 赞 i * -θ 赞 * ) 2 姨 ,其中θ * = 1 B B Σi=1 θ 赞 i * 。 下面通过实例说明标准误差 bootstrap 估计的 MATLAB 实现。 例 1 [8] 某种基金的年回报率是具有分布函数 F 的连续型随机变量,F 未知,F 的中位数 θ 是未知参 数。现有以下数据(%):18.2,9.5,12.0,21.1,10.2。 以样本中位数作为总体中位数 θ 的估计。试求中位数估计的标准误差的 bootstrap 估计。 编写求取 B 个总体中位数 θ 的 bootstrap 估计的函数,命名为 function1.m 文件,程序如下: function A=function1(X,B) for i=1:B,S=unidrnd(5,5,1);M=sort(X(S));A(i)=M(3);end 在命令窗口中输入 X=[18.2,9.5,12.0,21.1,10.2];A=function1(X,B);s=std(A),其中 B 是可变量,在 实际中应取 B≥1000,依次取 B=1000,2000,3000,4000,5000,运行上述过程即可求出 D(θ 姨 赞 )为 3.7179, 3.7818,3.7325,3.6884,3.7203。 2 估计量的均方误差及偏差的 bootstrap 估计 θ 赞是总体未知参数 θ 的估计量,θ 赞的均方误差定义为 MSE(θ 赞 )=E(θ 赞-θ) θ θ2 ,它度量了估计θ 赞与未知参数 θ 偏离的平均值的大小。一个好的估计应该有较小的均方误差。θ 赞关于 θ 的偏差定义为 b=E(θ 赞-θ),偏差是估 计量θ 赞无偏性的度量,当θ 赞是的 θ 无偏估计时 b=0。均方误差及偏差的 bootstrap 估计的求解步骤与标准误差 类似,只需将步骤 2)中计算θ 赞 i * 替换为计算(θ 赞 i * -θ) 2 和(θ 赞 i * -θ),将步骤 3)相应替换为 MSE(θ 赞 )= 1 B B Σi=1 (θ 赞 i * -θ) 2 , b= 1 B B Σi=1 (θ 赞 i * -θ)。下面通过实例说明估计量的均方误差及偏差的 bootstrap 估计的 MATLAB 实现。 例 2 [8] 设金属元素铂的升华热是具有分布函数 F 的连续型随机变量,F 的中位数 θ 是未知参数,现 测得以下数据(以 kcal/mol 计): 136.3,136.6,135.8,135.4,134.7,135.0,134.1,143.3,147.8 148.8,134.8,135.2,134.9,149.5,141.2,135.4,134.8,135.8 135.0,133.7,134.4,134.9,134.8,134.5,134.3,135.2 以样本中位数θ 赞=θ 赞 (X)作为总体中位数 θ 的估计。试求均方误差 MSE=E(θ 赞-θ) θ θ2 的 bootstrap 估计。 根据样本容易求得总体中位数 θ 的估计为 135.1,编写求取 B 个(θ 赞 i * -θ) 2 的函数 function2,其中 θ 赞 i * 是 第 i 个 bootstrap 样本的中位数,程序如下: 第 2 期 吴庆平,林素仙,黄 飞:非参数 bootstrap 方法及其 MATLAB 实现 15

16 丽水学院学报 2012年 function A=function2仅,B) fori1B. S=unidmd(26,26,D:M=sort(X(S):A(①=(M(13)+M1④)2-135.)2:emd 在命今窗▣中输入X=「1363,136.6.135.8.135.4.134.7,135.0,134.1.143.3.147.8.148.8.134.8.135.2 134.9.149.5,141.2,135.4,134.8.135.8,135.0,133.7,134.4,134.9,134.8.134.5,134.3,135.2:A=nction2 CX,B):m=mean(A),依次取B=1000,2000,3000,4000,5000,10000,运行上述过程即可求出MSE为 0.0610,0.0683,0.0650,0.0618,0.0634,0.0648。 例3调试在例2中,以样本中位数=C0作为总体中位数日的估计,求偏差b=E(-)的bootstrap 估计。 编写求取B个(-的函数anction3:,建立为finction3.m文件,程序如下: fiunction A=fiunction3(X,B) for卡1B, S=unidmd(26,26,1):M=so1tX(S)):A(D=((M(13)+M(14))2-135.1D:end 在命令窗口中输入X=[136.3,136.6,135.8,135.4,134.7,135.0,134.1,143.3,147.8,148.8,134.8,135.2 134.9,149.5,141.2,135.4,134.8,135.8,135.0,133.7,134.4,134.9,134.8,134.5,134.3,135.2]:A=-function3 《,B):m=mean(A),依次取B=1000,2000,3000,4000,5000,10000,运行上述过程即可求出b为 0.0575,0.0474,0.0466,0.0444,0.0434,0.0463。 3 bootstrap置信区间 总体参数0的置信水平为1-a的bootstrap置信区间的求解步骤为: D独立地抽取B个容量为n的bootstrap样本,x=(,i=1,2,B。对于第i个bootstr 样本,计算0=0x1,x2,.,i1,2,.,B。 2》将,d,.,0。自小到大排序,得o≤o≤.≤0m。 3)取k=B×号,k,=B×(1-g),以aa,分别作为6的估计,从而得到0的置信水平为 1-a的近似置信区间为(,8a,)。 下面通过实例说明bootstrap置信区间的MATLAB实现。 例4)在例2中:()以样本中位数作为总体中位数0的估计,求6的置信水平为0.95的bootstr即 置信区间:(②以样本20%截尾均值作为总体20%截尾均值的4,估计,求4,的置信水平为0.95的boos即 置信区间。 编写求取B个总体中位数bootstrap估计的函数finction4,fiunction4与functionl类似,程序如下: fiunction A=fiunction4(X,B) fori1B, 1994-2012 China Academic Journal Eleetronie Publishing House.All rights reserved.http://www.enki.net
function A=function2(X,B) for i=1:B, S=unidrnd(26,26,1);M=sort(X(S));A(i)=((M(13)+M(14))/2-135.1)^2;end 在命令窗口中输入 X=[136.3,136.6,135.8,135.4,134.7,135.0,134.1,143.3,147.8,148.8,134.8,135.2, 134.9,149.5,141.2,135.4,134.8,135.8,135.0,133.7,134.4,134.9,134.8,134.5,134.3,135.2];A=function2 (X,B);m=mean (A),依次取 B=1000,2000,3000,4000,5000,10000,运行上述过程即可求出 MSE 为 0.0610,0.0683,0.0650,0.0618,0.0634,0.0648。 例 3[8] 试在例 2 中,以样本中位数θ 赞 =θ 赞 (X)作为总体中位数 θ 的估计,求偏差 b=E(θ 赞 -θ)的 bootstrap 估计。 编写求取 B 个(θ 赞 1 * -θ)的函数 function3,建立为 function3.m 文件,程序如下: function A=function3(X,B) for i=1:B, S=unidrnd(26,26,1);M=sort(X(S));A(i)=((M(13)+M(14))/2-135.1);end 在命令窗口中输入 X=[136.3,136.6,135.8,135.4,134.7,135.0,134.1,143.3,147.8,148.8,134.8,135.2, 134.9,149.5,141.2,135.4,134.8,135.8,135.0,133.7,134.4,134.9,134.8,134.5,134.3,135.2];A=function3 (X,B);m=mean (A), 依 次 取 B=1000,2000,3000,4000,5000,10000, 运 行 上 述 过程即可求出 b 为 0.0575,0.0474,0.0466,0.0444,0.0434,0.0463。 3 bootstrap 置信区间 总体参数 θ 的置信水平为 1-α 的 bootstrap 置信区间的求解步骤[8]为: 1)独立地抽取 B 个容量为 n 的 bootstrap 样本,x *i =(x1 *i ,x2 *i ,.,xn *i ),i=1,2,.,B。对于第 i 个 bootstrap 样本,计算θ 赞 i * =θ 赞 (x1 *i ,x2 *i ,.,xn *i ),i=1,2,.,B。 2)将θ 赞 1 * ,θ 赞 2 * ,.,θ 赞 B * 自小到大排序,得θ 赞 (1) * ≤θ 赞 (2) * ≤.≤θ 赞 (B) * 。 3)取 k1 = B× α α α2 ,k2 = B×(1- α α α 2 ) ,以θ 赞 (k1 ) * ,θ 赞 (k2 ) * 分别作为θ 赞 α/2 * θ 赞 1-α/2 * 的估计,从而得到 θ 的置信水平为 1-α 的近似置信区间为(θ 赞 (k1 ) * ,θ 赞 (k2 ) * )。 下面通过实例说明 bootstrap 置信区间的 MATLAB 实现。 例 4[8] 在例 2 中:(1)以样本中位数作为总体中位数 θ 的估计,求 θ 的置信水平为 0.95 的 bootstrap 置信区间;(2)以样本 20%截尾均值作为总体 20%截尾均值的 μt估计,求 μt的置信水平为 0.95 的 bootstrap 置信区间。 编写求取 B 个总体中位数 θbootstrap 估计的函数 function4,function4 与 function1 类似,程序如下: function A=function4(X,B) for i=1:B, 16 丽 水 学 院 学 报 2012 年

第2期 吴庆平,林素仙,黄飞:非参数bootsta即方法及其MATLAB实现 17 S=unidmd(26,26,1D:M=otX(S):A(①=M(13)+M(1④)2:emd 在命令窗口中输入X-[136.3,136.6,135.8,135.4,134.7,135.0,134.1,143.3,147.8,148.8,134.8,135.2, 134.9,149.5,141.2,135.4,134.8,135.8,135.0,133.7,134.4,134.9,134.8,134.5,134.3,135.2:A=fiunction4《, 10000:A=s0t(A):B=[A250,A(9750],运行即可求得0的b0o5tap置信区间134.8000,135.8000 编写求取B个总体20%截尾均值bootstrap估计的函数nction5,程序如下: function A=fiunction5(X,B) fori1B, S=unidmd (26,26.1):M=sort(X (S))N=[M (324 ]A (=m ean (N)end 在命令窗▣中输入X=[136.3.136.6.135.8,135.4.134.7,135.0.134.1,143.3.147.8.148.8.134.8.135.2 134.9,149.5,141.2,135.4,134.8,135.8,135.0,133.7,134.4,134.9,134.8,134.5,134.3,135.2:A=-fiunction5 (X,10000:A=sot(A):B=[A(250,A(9750],运行即求得20%截尾均值的一个置信水平为0.95的boos 置信区间为135.0000,138.6045)。 4用bootstrap-t法求均值u的置信区间 总体具有正态分布,方差。未知时,我们可倍一求得的豆位水平为1心的 信区同-D了行。-》。若总体分布未知时,以样本均临作为总体均值丛的估 计,构造与1类似的枢轴量 W-IT (D 其中了,S是总体bootsra即样本的样本均值和样本标准差。以W的分布近似t的分布,取k,= [Bx号],k[Bx1-受,以分别作为e,e的估计,从面得到u的置信水平为1-a的近似 置信区间 ) 这种方法称为bootstrap-t方法)。下面通过实例说明bootstrap-t法求取bootstrap置信区间的 MATLAB实现。 例5调有30窝仔猪出生时各窝猪的存活只数 9,8,10,12,11,12,7,9,11,8,9,7,7,8,9,7,9,9,10,9,9,9,12,10,10,9,13,11,13,9 用bootsrap-t法求μ的置信水平为0.90的置信区间。 调用函数mean(《)和sd《)容易求得x=9.53,s=l.72,编写求取B个的函数finction6,程序如下: fiunction A=fiunction6(X,B) for i=1B, S=unidmd (30,30,1)M=X (S)A (=(m ean (M)-9.53)*sqrt(30)/td (M)end 94-012 China Academic oual Eleetronie Publishing House.All rights reserved.htp://www.enki.net
S=unidrnd(26,26,1);M=sort(X(S));A(i)=(M(13)+M(14))/2;end 在命令窗口中输入 X=[136.3,136.6,135.8,135.4,134.7,135.0,134.1,143.3,147.8,148.8,134.8,135.2, 134.9,149.5,141.2,135.4,134.8,135.8,135.0,133.7,134.4,134.9,134.8,134.5,134.3,135.2];A=function4(X, 10000);A=sort(A);B=[A(250),A(9750)],运行即可求得 θ 的 bootstrap 置信区间(134.8000,135.8000)。 编写求取 B 个总体 20%截尾均值 bootstrap 估计的函数 function5,程序如下: function A=function5(X,B) for i=1:B, S=unidrnd(26,26,1);M=sort(X(S));N=[M(3:24)];A(i)=mean(N);end 在命令窗口中输入 X=[136.3,136.6,135.8,135.4,134.7,135.0,134.1,143.3,147.8,148.8,134.8,135.2, 134.9,149.5,141.2,135.4,134.8,135.8,135.0,133.7,134.4,134.9,134.8,134.5,134.3,135.2];A=function5 (X,10000);A=sort(A);B=[A(250),A(9750)],运行即求得 20%截尾均值的一个置信水平为 0.95 的 bootstrap 置信区间为(135.0000,138.6045)。 4 用 bootstrap- t 法求均值 μ 的置信区间 总体 F 具有正态分布,方差 σ 2 未知时,我们可借助枢轴量 t= X -μ S/姨n 求得 μ 的置信水平为 1-α 的置 信区间(X - S 姨n tα/2(n-1),X + S 姨n tα/2(n-1))。若总体分布未知时,以样本均值x 作为总体均值 μ 的估 计,构造与 t 类似的枢轴量 W* = X * -x S * /姨n , (1) 其中X * ,S * 是总体 bootstrap 样本的样本均值和样本标准差。以 W* 的分布近似 t 的分布,取 k1= B× α 姨 姨2 ,k2 = B×(1- α 姨 姨 2 ) ,以 w * (k1 ),w * (k2 )分别作为 wα/2 * ,w1-α/2 * 的估计,从而得到 μ 的置信水平为 1-α 的近似 置信区间 (X -w* (k2 ) S 姨n ,X +w* (k1 ) S 姨n )。 (2) 这种方法称为 bootstrap-t 方法 [8]。下面通过实例说明 bootstrap-t 法求取 bootstrap 置信区间的 MATLAB 实现。 例 5[8] 有 30 窝仔猪出生时各窝猪的存活只数 9,8,10,12,11,12,7,9,11,8,9,7,7,8,9,7,9,9,10,9,9,9,12,10,10,9,13,11,13,9 用 bootstrap-t 法求 μ 的置信水平为 0.90 的置信区间。 调用函数 mean(X)和 std(X)容易求得x =9.53,s=1.72,编写求取 B 个 w * 的函数 function6,程序如下: function A=function6(X,B) for i=1:B, S=unidrnd(30,30,1);M=X(S);A(i)=(mean(M)-9.53)*sqrt(30)/std(M);end 第 2 期 吴庆平,林素仙,黄 飞:非参数 bootstrap 方法及其 MATLAB 实现 17

18 丽水学院学报 2012年 在命令窗口中输入X=[9,8,10,12,11,12,7,9,11,8,9,7,7,8,9,7,9,9,10,9,9,9,12,10,10,9,13, 11,13,9]:A=finction6X,100000):B=sort(A):C=[B(5000,B(95000],即可求得,0sm=-l.7965,0om =1.6106,再由(2)式即可求出4的置信水平为0.90的置信区间: (9.53-1.6106x172,9.53+1.7965x172)=9.0242,10.0941D。 30 V30 5结束语 本文通过MATLAB强大的计算和编程功能实现了非参数bootstrap方法,所举实例的求解结果与文献 [8]十分接近,偏差存在的原因是每次抽样获取的bootst即样本不同,从而导致计算结果的不同。从各编 写函数的程序式中可以发现,bootstrap方法的实现关键在于bootstrap样本的获取,本文调用了函数 unidmd(N,m,D实现了bootstrap样本的获取,该种方法可运用于文献[2-4]中相关bootstrap估计量的计 算,具有一定的实践意义。 参考文献: [1]Efion B.The Jackknife,the Bootstap.and 0 therR esam pling Pans[M ]PhildephiaIAM,1982. [2]韩开山.自回归系数的Bootstrap检验[0科技创新导报,2011(13):1-3. [3]许家清.基于分位数过程能力指数的Bootstrap置信区间[0.宁波大学学报:理工版,2010(②:47-51. [4)江海峰.小样本下相关系数的检验与区间估计一基于Bootstrap的研究[0.数理统计与管理,2011(3):440-446. [5]张金艳.概率密度函数核估计的Bootstrap逼近[0.纯粹数学与应用数学,2010(3):484-489. [6]赵树然,徐兴忠,任培民.删失回归模型的加权Bootstrap逼近[团.北京理工大学学报,2008(⑦):648-651 [7]陈红,吴汇川.Boot即方法及其应用[门.青岛大学学报:工程技术版,1997(3:78一83. [8)盛骤,谢式千,潘承毅.概率论与数理统计0].4版.北京:高等教有出版社,2008:270-281. [9可薛定字,陈阳泉.高等应用数学问愿的MATLAB求解M].2版北京:清华大学出版社,2010:17,325. 1994-2012 China Academic Journal Eleetronie Publishing House.All rights reserved.http://www.enki.net
在命令窗口中输入 X=[9,8,10,12,11,12,7,9,11,8,9,7,7,8,9,7,9,9,10,9,9,9,12,10,10,9,13, 11,13,9];A=function6(X,100000);B=sort(A);C=[B(5000),B(95000)],即可求得,w * (5000)=-1.7965,w * (95000) =1.6106,再由(2)式即可求出 μ 的置信水平为 0.90 的置信区间: (9.53-1.6106× 1.72 姨30 ,9.53+1.7965× 1.72 姨30 )=(9.0242,10.0941)。 5 结束语 本文通过 MATLAB 强大的计算和编程功能实现了非参数 bootstrap 方法,所举实例的求解结果与文献 [8]十分接近,偏差存在的原因是每次抽样获取的 bootstrap 样本不同,从而导致计算结果的不同。从各编 写函数的程序式中可以发现,bootstrap 方法的实现关键在于 bootstrap 样本的获取,本文调用了函数 unidrnd(N,m,n)实现了 bootstrap 样本的获取,该种方法可运用于文献[2-4]中相关 bootstrap 估计量的计 算,具有一定的实践意义。 参考文献: [1]Efron B.The Jackknife,the Bootstrap,and Other Resampling Plans[M].Philadelphia:SIAM,1982. [2]韩开山.自回归系数的 Bootstrap 检验[J].科技创新导报,2011(13):1-3. [3]许家清.基于分位数过程能力指数的 Bootstrap 置信区间[J].宁波大学学报:理工版,2010(2):47-51. [4]江海峰.小样本下相关系数的检验与区间估计——基于 Bootstrap 的研究[J].数理统计与管理,2011(3):440-446. [5]张金艳.概率密度函数核估计的 Bootstrap 逼近[J].纯粹数学与应用数学,2010(3):484-489. [6]赵树然,徐兴忠,任培民. 删失回归模型的加权 Bootstrap 逼近[J].北京理工大学学报,2008(7):648-651. [7]陈红,吴汇川.Bootstrap 方法及其应用[J].青岛大学学报:工程技术版,1997(3):78—83. [8]盛骤,谢式千,潘承毅.概率论与数理统计[M].4 版.北京:高等教育出版社,2008:270-281. [9]薛定宇,陈阳泉.高等应用数学问题的 MATLAB 求解[M].2 版.北京:清华大学出版社,2010:17,325. 18 丽 水 学 院 学 报 2012 年
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 《医学统计学》课程教学资源(文献资料)结构方程模型与SmartPLS软件应用.pptx
- 《医学统计学》课程教学资源(文献资料)灰色关联分析方法.ppt
- 《医学统计学》课程教学资源(文献资料)最大似然估计.ppt
- 《医学统计学》课程教学资源(文献资料)决策树分类算法.ppt
- 《医学统计学》课程教学资源(文献资料)Three primary input styles in SAS(三种基本输入方法).ppt
- 《医学统计学》课程教学资源(文献资料)非参数bootstrap方法.pptx
- 《医学统计学》课程教学资源(文献资料)决策树中ID3算法与C4.5算法分析与比较.pdf
- 《医学统计学》课程教学资源(SAS相关材料)5 相关与回归分析.pdf
- 《医学统计学》课程教学资源(SAS相关材料)4 方差分析.pdf
- 《医学统计学》课程教学资源(SAS相关材料)3 SAS基本统计过程(二).pdf
- 《医学统计学》课程教学资源(SAS相关材料)2 SAS基本统计过程(一).pdf
- 《医学统计学》课程教学资源(SAS相关材料)1 SAS基础.pdf
- 《医学统计学》课程教学课件(PPT讲稿)绪论.ppt
- 《医学统计学》课程教学课件(PPT讲稿)统计图表(Statistical Table & Statistical Chart).ppt
- 《医学统计学》课程教学课件(PPT讲稿)相对数(Relative Number)及其应用.ppt
- 《医学统计学》课程教学课件(PPT讲稿)常用概率分布.ppt
- 《医学统计学》课程教学课件(PPT讲稿)假设检验和t检验.ppt
- 《医学统计学》课程教学课件(PPT讲稿)方差分析 Analysis of Variance, ANOVA.ppt
- 《医学统计学》课程教学课件(PPT讲稿)假设检验和t检验.ppt
- 《医学统计学》课程教学课件(PPT讲稿)卡方检验 Chi-square test(x2).ppt
- 《医学统计学》课程教学资源(文献资料)统计方法在循证医学中的应用.pptx
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题1(试卷).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题1(答案).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题2(试卷).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题2(答案).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题3(试卷).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题3(答案).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题4(试卷).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题4(答案).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题5(试卷).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题5(答案).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题6(试卷).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题6(答案).doc
- 《临床检验仪器学》课程实验教学大纲 Clinical Laboratory Instruments.doc
- 《临床检验仪器学》课程教学资源(讲义)实验09 荧光分光光度计的使用.doc
- 《临床检验仪器学》课程教学资源(讲义)实验10 尿液自动分析仪的使用与调校.doc
- 《临床检验仪器学》课程教学资源(讲义)实验11 生化分析仪的参数设置及性能评价.doc
- 《临床检验仪器学》课程教学资源(讲义)实验12 微量加样器不同加样方式对检验结果的影响.doc
- 《临床检验仪器学》课程教学资源(讲义)实验07 模拟光电型血细胞计数器.doc
- 《临床检验仪器学》课程教学资源(讲义)实验05 普通离心机的使用、调校及维护.doc