中国高校课件下载中心 》 教学资源 》 大学文库

《数学模型与数学实验》课程书籍文献(数学建模算法大全)第11章 方差分析

文档信息
资源类别:文库
文档格式:PDF
文档页数:13
文件大小:168.03KB
团购合买:点击进入团购
内容简介
《数学模型与数学实验》课程书籍文献(数学建模算法大全)第11章 方差分析
刷新页面文档预览

第十一章方差分析 我们已经作过两个总体均值的假设检验,如两台机床生产的零件尺寸是否相等,病 人和正常人的某个生理指标是否一样。如果把这类问题推广一下,要检验两个以上总体 的均值彼此是否相等,仍然用以前介绍的方法是很难做到的。而你在实际生产和生活中 可以举出许多这样的问题:从用几种不同工艺制成的灯泡中,各抽取了若干个测量其考 之成的 !泡寿命是有业者左;用 儿个小麦品种在 里种植 肥和品种对产量有无显著号 行分以 响的那些因素,除了从机方 面进 量的因素边 究外 ,寻求想律。用数理续计分析试验结果、鉴别各因素对结果影响程 度的方法称为方差分析A of ),记作ANOVA 人们关心 的试验结果称为指标,试验中需要考察、可以控制的条件称为因素或因子 因素所处的状态称为水平。上面提到的灯泡寿命问题是单因素试验,小麦产量问题是双 因素试验。处理这些试验结果的统计方法就称为单因素方差分析和双因素方差分析。 §1单因素方差分析 对所关心的指标 个试 试验过程 的 水平上作若干 有无显 从试验结果推断,因4对指标有无显若影的 即当A取不同水平时指村 4取某个水平下的指标视为随机变量,判断A取不同水平时指标有无显著差别, 相当于检验若干总体的均值是否相等。 11勒学横刷 设A取r个水平A,A,A,在水平A下总体x服从正态分布N(4,G) i=1,“,P,这里4,G2未知,丛,可以互不相同,但假定x,有相同的方差。又设在每 个水平A下作了n次独立试验,即从中抽取容量为n,的样本,记作x,=1,·x 服从N(4,0),i=1.,=1,.,且相互独立。将这些数据列成表1(单因素试 验数据表)的形式。 表」 单因素试验数据表 X12 Xin A x 将第i行称为第i组数据。判断A的r个水平对指标有无显著影响,相当于要作以 下的假设检验 H。=2=.=4,:H:4,42,4不全相等 由于x,的取值既受不同水平A的影响,又受A,固定下随机因素的影响,所以将它 分解为 x,=4+8gi=1.,r,j=l.,n (1) -213

-213- 第十一章 方差分析 我们已经作过两个总体均值的假设检验,如两台机床生产的零件尺寸是否相等,病 人和正常人的某个生理指标是否一样。如果把这类问题推广一下,要检验两个以上总体 的均值彼此是否相等,仍然用以前介绍的方法是很难做到的。而你在实际生产和生活中 可以举出许多这样的问题:从用几种不同工艺制成的灯泡中,各抽取了若干个测量其寿 命,要推断这几种工艺制成的灯泡寿命是否有显著差异;用几种化肥和几个小麦品种在 若干块试验田里种植小麦,要推断不同的化肥和品种对产量有无显著影响。 可以看到,为了使生产过程稳定,达到优质、高产,需要对影响产品质量的因素进 行分析,找出有显著影响的那些因素,除了从机理方面进行研究外,常常要作许多试验, 对结果作分析、比较,寻求规律。用数理统计分析试验结果、鉴别各因素对结果影响程 度的方法称为方差分析(Analysis Of Variance),记作 ANOVA。 人们关心的试验结果称为指标,试验中需要考察、可以控制的条件称为因素或因子, 因素所处的状态称为水平。上面提到的灯泡寿命问题是单因素试验,小麦产量问题是双 因素试验。处理这些试验结果的统计方法就称为单因素方差分析和双因素方差分析。 §1 单因素方差分析 只考虑一个因素 A 对所关心的指标的影响, A 取几个水平,在每个水平上作若干 个试验,试验过程中除 A 外其它影响指标的因素都保持不变(只有随机因素存在),我 们的任务是从试验结果推断,因素 A 对指标有无显著影响,即当 A 取不同水平时指标 有无显著差别。 A 取某个水平下的指标视为随机变量,判断 A 取不同水平时指标有无显著差别, 相当于检验若干总体的均值是否相等。 1.1 数学模型 设 A 取 r 个水平 A A Ar , , , 1 2 L ,在水平 Ai 下总体 i x 服从正态分布 ( , ) 2 N μi σ , i = 1,L,r ,这里 2 μi ,σ 未知, μi 可以互不相同,但假定 i x 有相同的方差。又设在每 个水平 Ai 下作了 ni 次独立试验,即从中抽取容量为 ni 的样本,记作 ij ni x , j =1,L, , ij x 服从 ( , ) 2 N μi σ , ni i =1,L,r, j =1,L, 且相互独立。将这些数据列成表 1(单因素试 验数据表)的形式。 表 1 单因素试验数据表 A1 11 x 12 x . 1n1 x A2 21 x 22 x . 2n2 x . . . . . Ar r1 x r 2 x . r rn x 将第i 行称为第i 组数据。判断 A 的 r 个水平对指标有无显著影响,相当于要作以 下的假设检验 H0 μ1 = μ2 =L= μ r : ; H μ μ μ r : , , , 1 1 2 L 不全相等 由于 ij x 的取值既受不同水平 Ai 的影响,又受 Ai 固定下随机因素的影响,所以将它 分解为 ij i ij x = μ + ε ,i = 1,L,r , ni j =1,L, (1)

其中6,~N(0,o2),且相互独立。记 u=2n4,m=24,a,=4,-4,1=1.r 3 4是总均值,4是水平A对指标的效应。由(1)、(2)模型可表为 x,=μ+,+E (3) 5y~N0,2i=l,j=1,.,m 原假设为(以后略去备选假设) H。:C1=,=.=0.=0 (4) 是统计分折 2空 (5) 无。是第í组数据的组平均值,是总平均值。考察全休数据对的偏差平方和 S=22x,- (6) 经分解可得 S=n(属-+22x,-元户 记 S4=∑n(民.- (7) s-22, (8) 则 ST=S+Sg (9) S,是各组均值对总方差的偏差平方和,称为组间平方和:S£是各组内的数据对均值偏 差平方和的总和。S,反映A不同水平间的差异,S:则表示在同一水平下随机误差的 大小。 注意到∑(3,-元广户是总体N(以,。)的样本方差的片-1倍,于是有 26,-/a2-2m-) 由x2分布的可加性知 -214

-214- 其中 ~ (0, ) 2 ε ij N σ ,且相互独立。记 ∑= = r i ni i n 1 1 μ μ , ∑= = r i n ni 1 ,αi = μi − μ , i = 1,L,r (2) μ 是总均值,αi 是水平 Ai 对指标的效应。由(1)、(2)模型可表为 ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ = = = = + + ∑= ij i r i i ij i ij N i r j n x ~ (0, ), 1, , , 1, , 0 2 1 ε σ L L α μ α ε (3) 原假设为(以后略去备选假设) H0 :α1 = α 2 =L= α r = 0 (4) 1.2 统计分析 记 ∑= • = i n j ij i i x n x 1 1 , ∑∑= = = r i n j ij i x n x 1 1 1 (5) i• x 是第i 组数据的组平均值, x 是总平均值。考察全体数据对 x 的偏差平方和 ∑∑= = = − r i n j T ij i S x x 1 1 2 ( ) (6) 经分解可得 ∑ ∑∑= = • = = • − + − r i n j ij i r i T i i i S n x x x x 1 1 2 1 2 ( ) ( ) 记 ∑= = • − r i A i i S n x x 1 2 ( ) (7) ∑∑= = = − • r i n j E ij i i S x x 1 1 2 ( ) (8) 则 T A E S = S + S (9) A S 是各组均值对总方差的偏差平方和,称为组间平方和; E S 是各组内的数据对均值偏 差平方和的总和。 A S 反映 A 不同水平间的差异, E S 则表示在同一水平下随机误差的 大小。 注意到∑= − • ni j ij i x x 1 2 ( ) 是总体 ( , ) 2 N μi σ 的样本方差的ni −1倍,于是有 ( ) ~ ( 1) 2 1 2 2 ∑ − − = • i n j xij xi n i σ χ 由 2 χ 分布的可加性知

S:/a'-x(n 即 Sslo2~z(n-r) 且有 ESg =(n-r)o 10 对S,作进一步分析可得 B,=r-lg+∑nc (11 当H。成立时 ES=(r-1)a (12) 可知若H。成立,S,只反映随机波动,而若H。不成立,那它就还反映了A的不同水平 的效应,·单从数值上看,当H。成立时,由(10)、(12)对于一次试验应有 Sw-0≈1 SgIn-r) 而当H。不成立时这个比值将远大于1。当H。成立时,该比值服从自由度n,=r-1, n=(n-r)的F分布,即 F=S,-) -F(r-1,n-r) (13) S。n-r) 为检验H。,给定显若性水平a,记F分布的1-a分位数为F(r-,(n-r),检验 规则为 F -215

-215- ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ∑ − = r i SE ni 1 2 2 σ ~ χ ( 1) 即 ~ ( ) 2 2 S n r E σ χ − 且有 2 ESE = (n − r)σ (10) 对 A S 作进一步分析可得 ∑= = − + r i A ni i ES r 1 2 2 ( 1)σ α (11) 当 H0 成立时 2 ES A = (r −1)σ (12) 可知若 H0 成立, A S 只反映随机波动,而若 H0 不成立,那它就还反映了 A 的不同水平 的效应αi 。单从数值上看,当 H0 成立时,由(10)、(12)对于一次试验应有 1 /( ) /( 1) ≈ − − S n r S r E A 而当 H0 不成立时这个比值将远大于 1。当 H0 成立时,该比值服从自由度 1 n1 = r − , ( ) 2 n = n − r 的 F 分布,即 ~ ( 1, ) /( ) /( 1) F r n r S n r S r F E A − − − − = (13) 为检验 H0 ,给定显著性水平α ,记 F 分布的1−α 分位数为 ( 1,( )) 1 F r − n − r −α ,检验 规则为 ( 1,( )) 1 F α

方差分析一般用的显著性水平是:取α=0.01,拒绝H。,称因素A的影响(或A 各水平的差异)非常显若:取a=0.01,不拒绝H。,但取a=0.05,拒绝H。,称因 素A的影响显著:取α=0.05,不拒绝H。,称因素A无显若影响。 若各组数据个数相等,称为均衡数据。若各组数据个数不等,称非均衡数据。 (1)均衡数据 处理均衡数据的用法为: p=anoval(x) 返回值D是一个概率,当D>位时接受H。,X为m×r的数据矩阵,X的每一列是一个 水平的数据(这里各个水平上的样本容最,=m)。另外,还输出一个方差表和一个 Box图. 内考察 平均值,如 天的产量,并算出其 表3 天以 236 2 280 230 305 20 平均产量269 29225264.75 解编写程序如下: 330 248 280 290 305 220 2 a1395 389 2892521: p-a 求得p=0.1109>a=005,故接受H。,即5名工人的生产率没有显若差异,方 差表对应于上面的单因素方差分析表的1~4列,F=2.262是F(4,15)分布的1-p分 位数,可以验证 fcdf(2.262,4,15)=0.8891=1-p Box图反映了各组数据的特征。 注:接受H。,是将5名工人的生产率作为一个整体进行假设检验的结果,并不表 明取其中2个工人的生产率作两总体的均值检验时,也一定接受均值相等的假设。实际 上,读者可以用ttesta2对本题作H。:凸=的检验,看看会得到什么结果。 x为向以第组到第组数据依次挂列: 为与x同长度的向量,标志x中数 据的组别(在与第/搭对应的位置处整飞, .,r)) -216-

-216- 方差分析一般用的显著性水平是:取α = 0.01,拒绝 H0 ,称因素 A 的影响(或 A 各水平的差异)非常显著;取α = 0.01,不拒绝 H0 ,但取α = 0.05 ,拒绝 H0 ,称因 素 A 的影响显著;取α = 0.05 ,不拒绝 H0 ,称因素 A 无显著影响。 1.4 Matlab 实现 Matlab 统计工具箱中单因素方差分析的命令是 anoval。 若各组数据个数相等,称为均衡数据。若各组数据个数不等,称非均衡数据。 (1)均衡数据 处理均衡数据的用法为: p=anoval(x) 返回值 p 是一个概率,当 p > α 时接受 H0 ,x 为m× r 的数据矩阵,x 的每一列是一个 水平的数据(这里各个水平上的样本容量 ni = m )。另外,还输出一个方差表和一个 Box 图。 例 1 为考察 5 名工人的劳动生产率是否相同,记录了每人 4 天的产量,并算出其 平均值,如表 3。你能从这些数据推断出他们的生产率有无显著差别吗? 表 3 工人 天 A1 A2 A3 A4 A5 1 256 254 250 248 236 2 242 330 277 280 252 3 280 290 230 305 220 4 298 295 302 289 252 平均产量 269 292.25 264.75 280.5 240 解 编写程序如下: x=[256 254 250 248 236 242 330 277 280 252 280 290 230 305 220 298 295 302 289 252]; p=anova1(x) 求得 p = 0.1109 >α = 0.05,故接受 H0 ,即 5 名工人的生产率没有显著差异。方 差表对应于上面的单因素方差分析表的1 ~ 4 列,F = 2.262 是 F(4,15) 分布的1− p 分 位数,可以验证 fcdf(2.262,4,15)=0.8891=1-p Box 图反映了各组数据的特征。 注:接受 H0 ,是将 5 名工人的生产率作为一个整体进行假设检验的结果,并不表 明取其中 2 个工人的生产率作两总体的均值检验时,也一定接受均值相等的假设。实际 上,读者可以用 ttest2 对本题作 0 2 5 H : μ = μ 的检验,看看会得到什么结果。 (2)非均衡数据 处理非均衡数据的用法为: p=anova1(x,group) x 为向量,从第 1 组到第 r 组数据依次排列;group 为与 x 同长度的向量,标志 x 中数 据的组别(在与 x 第i 组数据相对应的位置处输入整数i(i = 1,2,L,r))

灯泡,从各种工艺制成的灯泡中各抽出了若干个测量其寿命, 表4 、工 A 序号 6网 170 1640 1620 161n 175 1720 1680 5 1800 解编写程序如下: 1500 1700 1640 1620 1610 x=[x1:4),x16), ×112:151 1 g-one5,5),2*0ne5,4),3*one,3,4*ones1,41: pang 09 0.0331<0.05,所以几种工艺制成的灯泡寿命有显著差异 多重比 在灯泡寿命问题中,为了确定哪几种工艺制成的灯泡寿命有显著差异,我们先算出 各组数据的均值: 老 均值 1708 1635 15401585 虽然A的均值最大,但要判断它与其它几种有显著差异,还需做多重比较。一般 多重比较要对所有?个总体作两两对比,分析相互间的差异。根据问题的具体情况可以 减少对比次数。 X=上器。t多重比较的程序为 67 155 1700 1640 1620 161 x=[x(1:4) 728),x50,x902x12:1511 g=[ones(1,5),2*ones(1,4),3*one3(1,3),4*ones(1,4)1: ompare(st): [nms num2cel1(m)】 双因素方差分析 果费考 两个因系A,B对指标的影明, A,B各划分几个水平 一个水平组 合作 检对所得数据进 验两因素是否分别对指标有显著影响: 立两因素是否对指标有显著的交互影响 数 设A取r个水平A,A,A,B取s个水平B,B2,B,在水平组合(A,B,) -217-

-217- 例 2 用 4 种工艺生产灯泡,从各种工艺制成的灯泡中各抽出了若干个测量其寿命, 结果如下表,试推断这几种工艺制成的灯泡寿命是否有显著差异。 表 4 工艺 A1 A2 A3 A4 序号 1 1620 1580 1460 1500 2 1670 1600 1540 1550 3 1700 1640 1620 1610 4 1750 1720 1680 5 1800 解 编写程序如下: x=[1620 1580 1460 1500 1670 1600 1540 1550 1700 1640 1620 1610 1750 1720 1680 1800]; x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)]; g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)]; p=anova1(x,g) 求得 0.01<p=0.0331<0.05,所以几种工艺制成的灯泡寿命有显著差异。 1.5 多重比较 在灯泡寿命问题中,为了确定哪几种工艺制成的灯泡寿命有显著差异,我们先算出 各组数据的均值: 工艺 A1 A2 A3 A4 均值 1708 1635 1540 1585 虽然 A1 的均值最大,但要判断它与其它几种有显著差异,还需做多重比较。一般 多重比较要对所有 r 个总体作两两对比,分析相互间的差异。根据问题的具体情况可以 减少对比次数。 对于上述问题,Matlab 多重比较的程序为 x=[1620 1580 1460 1500 1670 1600 1540 1550 1700 1640 1620 1610 1750 1720 1680 1800]; x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)]; g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)]; [p,t,st]=anova1(x,g) [c,m,h,nms] = multcompare(st); [nms num2cell(m)] §2 双因素方差分析 如果要考虑两个因素 A,B 对指标的影响, A,B 各划分几个水平,对每一个水平组 合作若干次试验,对所得数据进行方差分析,检验两因素是否分别对指标有显著影响, 或者还要进一步检验两因素是否对指标有显著的交互影响。 2.1 数学模型 设 A 取 r 个水平 A A Ar , , , 1 2 L ,B 取 s 个水平 B B Bs , , , 1 2 L ,在水平组合( , ) Ai Bj

下总体x,服从正态分布N(4,02),i=L.,r,广=1,.,5。又设在水平组合(4,B,) 下作了t个试验,所得结果记作x,x服从N(4,o),i=1,.,P,j=L.,s, k=1,1,且相互独立。将这些数据列成表5的形式 表5双因素试验数据表 I B B X21.X2 Xl.X,r 将x分解为 xm=4g+5,i=1.,r,广=1.,5,k=l,.,l (14) 其中6~N(0,2),且相互独立。记 ls- S 4=24,B=-4,=4-a- (15) 4是总均值,a是水平A,对指标的效应,B,是水平B,对指标的效应,是水平A,与 B,对指标的交互效应。模型表为 x=4+a,+P,+y,+8 2a==2,=0 (16) E~N(0,o2),i=1,.,rj=1,.,5,k=1,.,1 原假设为 H1a,=0i=L.,r) (17) Ho2:B,=0j=1,.,s (18) Ho3:ym=0i=l.,5,j=l.,s) (19) 2.2无交互影响的双因素方差分析 如果根据经验或某种分析能够事先判定两因素之间没有交互影响,每组试验就不必 重复,即可令1=1,过程大为简化。 假设Yg=0,于是 4g=μ+a,+B,i=l,.,r,j=1,.,S 此时,模型(16)可写成 -218

-218- 下总体 ij x 服从正态分布 ( , ) 2 N μij σ ,i =1,L,r ,j =1,L,s 。又设在水平组合( , ) Ai Bj 下作了t 个试验,所得结果记作 ijk x , ijk x 服从 ( , ) 2 N μij σ ,i =1,L,r , j =1,L,s , k = 1,L,t ,且相互独立。将这些数据列成表 5 的形式。 表 5 双因素试验数据表 B1 B2 . Bs A1 t x x 111L 11 t x x 121L 12 . s st x x 1 1L 1 A2 t x x 211L 21 t x x 221L 22 . s st x x 2 1L 2 M M M M M Ar r r t x x 11L 1 r r t x x 21L 2 . rs rst x Lx 1 将 ijk x 分解为 ijk ij ijk x = μ +ε ,i =1,L,r , j =1,L,s ,k = 1,L,t (14) 其中 ~ (0, ) 2 ε ijk N σ ,且相互独立。记 ∑∑= = = r i s j ij rs 1 1 1 μ μ , ∑= • = s j i ij s 1 1 μ μ ,αi = μi• − μ ∑= • = r i j ij r 1 1 μ μ ,β j = μ• j − μ , ij μij μ αi β j γ = − − − (15) μ 是总均值,αi 是水平 Ai 对指标的效应,β j 是水平 Bj 对指标的效应, ij γ 是水平 Ai 与 Bj 对指标的交互效应。模型表为 ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ = = = = = = = = + + + + ∑ ∑ ∑∑ = = == N i r j s k t x ijk r i s j r i s j i j ij ij ijk i j ij ijk ~ (0, ), 1, , , 1, , , 1, , 0, 0, 0 2 1 1 11 ε σ L L L α β γ γ μ α β γ ε (16) 原假设为 : 0( 1, , ) 01 H i r αi = = L (17) : 0( 1, , ) 02 H j s β j = = L (18) : 0( 1, , ; 1, , ) 03 H i r j s γ ij = = L = L (19) 2.2 无交互影响的双因素方差分析 如果根据经验或某种分析能够事先判定两因素之间没有交互影响,每组试验就不必 重复,即可令t = 1,过程大为简化。 假设γ ij = 0 ,于是 μij = μ +αi + β j ,i =1,L,r , j =1,L,s 此时,模型(16)可写成

xg=u+a,+月,+6g 24=02A=0 (20) Ey-N(0,a2)i=1.,j=1,s 对这个模型我们所要检验的假设为式(17)和式(18)。下面采用与单因素方差分析模 型类似的方法导出检验统计量。 记 ,=22,- 其中S,为全部试验数据的总变差,称为总平方和,对其进行分解 s拉4到 -空成++2民+空民-列 =Sg+S+S 可以验证,在上述平方和分解中交叉项均为0。其中 522-成+ 5,=2元.-,5。=r民,- 我们先来看看S,的统计意义。因为x.是水平A下所有观测值的平均,所以 ∑(民。一)反映了不不,.,x.差异的程度。这种差异是由于因素A的不同水平所 引起的,因此S,称为因素A的平方和。类似地,S称为因素B的平方和。至于S的 意义不甚明显,我们可以这样来理解: 因为 SE=ST-S4-S8 (21 在我们所考虑的两因素问题中,除了因素A和B之外,剩余的再没有其它系统性因素 的影响,因此从总平方和中减去S,和S。之后,利下的数据变差只能归入随机误差,故 Se反映了试验的随机误差。 有了总平方和的分解式 Sr=Ss+S,+S。 以及各个平方和的统计意义,我们就可以明白,假设(17)的检验统计量应取为S,与S 的比。 和一元方差分析相类似,可以证明,当H,成立时, 219

-219- ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ = = = = = + + + ∑ ∑ = = N i r j s x ij r i s j i j ij i j ij ~ (0, ), 1, , , 1, , 0, 0 2 1 1 ε σ L L α β μ α β ε (20) 对这个模型我们所要检验的假设为式(17)和式(18)。下面采用与单因素方差分析模 型类似的方法导出检验统计量。 记 ∑∑= = = r i s j ij x rs x 1 1 1 , ∑= • = s j i ij x s x 1 1 , ∑= • = r i j ij x r x 1 1 ∑∑= = = − r i s j T ij S x x 1 1 2 ( ) 其中 T S 为全部试验数据的总变差,称为总平方和,对其进行分解 ∑∑= = = − r i s j T ij S x x 1 1 2 ( ) ∑ ∑ ∑ ∑ = = • = • = = − • − • + + − + − r i s j j r i i s s ij i j x x x x s x x r x x 1 1 2 1 2 1 2 ( ) ( ) ( ) E A B = S + S + S 可以验证,在上述平方和分解中交叉项均为 0。其中 ∑∑= = = − • − • + r i s s E ij i j S x x x x 1 1 2 ( ) ∑= = • − r i A i S s x x 1 2 ( ) , ∑= = • − s j B j S r x x 1 2 ( ) 我们先来看看 A S 的统计意义。因为 i• x 是水平 Ai 下所有观测值的平均,所以 ∑= • − r i i x x 1 2 ( ) 反映了 • • r• x , x , , x 1 2 L 差异的程度。这种差异是由于因素 A 的不同水平所 引起的,因此 A S 称为因素 A 的平方和。类似地, B S 称为因素 B 的平方和。至于 E S 的 意义不甚明显,我们可以这样来理解:因为 E T A B S = S − S − S (21) 在我们所考虑的两因素问题中,除了因素 A 和 B 之外,剩余的再没有其它系统性因素 的影响,因此从总平方和中减去 A S 和 B S 之后,剩下的数据变差只能归入随机误差,故 E S 反映了试验的随机误差。 有了总平方和的分解式 T E A B S = S + S + S 以及各个平方和的统计意义,我们就可以明白,假设(17)的检验统计量应取为 A S 与 E S 的比。 和一元方差分析相类似,可以证明,当 H01成立时

S r-1 F4=一 一F(r-1,(r-10s-1) (22) (r-l)(s-1) 当Hm成立时, Fn= ~Fs-1,-10s-1) (23 (r-10s-1) 检验规则为 F,<F(r-1,(r-1(s-1)时接受H。,否则拒绝H: F。<F.(s-1,(r-1)(s-1)时接受H2,否则拒绝H· 我们可以写出方差分析表,如表6所示。 方差来源 平方和 “ 比 因素A S r-1 5岛 S SE 因素B S& 3-1 可-马 误差 Sg (r-1s-1) SE 5.=(r-IX3-D 总和 S 写的双四素方差分折 品2落.名 将全体数据对x的偏差平方和 S,=22x4- (24) 进行分解,可得 ST=SE+++ (25) 其中 5-222.5=2低列 -220

-220- ~ ( 1,( 1)( 1)) ( 1)( 1) 1 − − − − − − = F r r s r s S r S F E A A (22) 当 H02 成立时, ~ ( 1,( 1)( 1)) ( 1)( 1) 1 − − − − − − = F s r s r s S s S F E B B (23) 检验规则为 ( 1,( 1)( 1)) FA < F1−α r − r − s − 时接受 H01,否则拒绝 H01; ( 1,( 1)( 1)) FB < F1−α s − r − s − 时接受 H02 ,否则拒绝 H02 。 我们可以写出方差分析表,如表 6 所示。 表 6 无交互效应的两因素方差分析表 方差来源 平方和 自由度 均方 F 比 因素 A A S r −1 −1 = r S S A A E A S S 因素 B B S s −1 −1 = s S S B B E B S S 误差 E S (r −1)(s −1) ( −1)( −1) = r s S S E E 总和 T S rs −1 2.3 关于交互效应的双因素方差分析 与前面方法类似,记 ∑∑∑ === = r i s j t k ijk x rst x 111 1 , ∑= • = t k ij ijk x t x 1 1 ∑∑= = •• = s j t k i ijk x st x 1 1 1 , ∑∑= = • • = r i t k j ijk x rt x 1 1 1 将全体数据对 x 的偏差平方和 ∑∑∑ = == = − r i s j t k T ijk S x x 111 2 ( ) (24) 进行分解,可得 T E A B AB S = S + S + S + S (25) 其中 ∑∑∑ === = − • r i s j t k E ijk ij S x x 111 2 ( ) , ∑= = •• − r i A i S st x x 1 2 ( )

Sn=m2民.-2,SB=22民-元n+ 称S:为误差平方和,S,为因素A的平方和(或行间平方和),S。为因素B的平方和 (或列间平方和),S,为交互作用的平方和(或格间平方和)。 可以证明,当H成立时 F.-(F-1X-D-F((r-IXs-D.ns(-D) (26 rs(t-1) 据此统计量,可以检验H 检验因子A和B的各个水平的效应是否有差异,与22中的检验是一样的。 将试验数据按上述分析、计算的结果排成表7的形式,称为双因素方差分析表。 表关于交互效应的两因素方差分析表 方差来源 平方和 白由度 均行 F比 因素A S r-1 S= r-1 SE 因B 5-1 s-1 交互效应 SAB (r-1s-) 5B= (r-10s-1) 误差 SE 5= S。 rs(t-1) 总和 s1-1 计其特中2作双素有花分折。命今为 其中 的数 示单一因素的变化情况,不同行中的 据表示另 因素 变化端 元。种水行闲老有两种水平,相每组大平有西组样大 值的不同标马 的次数 的矩阵 列因 相应地用下标来标识: X211X221X23 X 一种火箭使用了四种燃 合作 一次试验,得到试验数据如表8。问各种 及各种推进器之间 -221-

-221- ∑= = • • − s j B j S rt x x 1 2 ( ) , ∑∑= = = • − •• − • • + r i s j AB ij i j S t x x x x 1 1 2 ( ) 称 E S 为误差平方和, A S 为因素 A 的平方和(或行间平方和), B S 为因素 B 的平方和 (或列间平方和), AB S 为交互作用的平方和(或格间平方和)。 可以证明,当 H03 成立时 ~ (( 1)( 1), ( 1)) ( 1) ( 1)( 1) − − − − − − = F r s rs t rs t S r s S F E AB AB (26) 据此统计量,可以检验 H03 。 检验因子 A 和 B 的各个水平的效应是否有差异,与 2.2 中的检验是一样的。 将试验数据按上述分析、计算的结果排成表 7 的形式,称为双因素方差分析表。 表 7 关于交互效应的两因素方差分析表 方差来源 平方和 自由度 均方 F 比 因素 A A S r −1 −1 = r S S A A E A S S 因素 B B S s −1 −1 = s S S B B E B S S 交互效应 AB S (r −1)(s −1) ( −1)( −1) = r s S S AB AB E AB S S 误差 E S rs(t −1) ( −1) = rs t S S E 总和 T S rst −1 2.4 Matlab 实现 统计工具箱中用 anova2 作双因素方差分析。命令为 p=anova2(x,reps) 其中 x 不同列的数据表示单一因素的变化情况,不同行中的数据表示另一因素的变化情 况。如果每种行—列对(“单元”)有不止一个的观测值,则用参数 reps 来表明每个“单 元”多个观测值的不同标号,即 reps 给出重复试验的次数t 。下面的矩阵中,列因素 有 3 种水平,行因素有两种水平,但每组水平有两组样本,相应地用下标来标识: ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ 212 222 232 211 221 231 112 122 132 111 121 131 x x x x x x x x x x x x 例 3 一种火箭使用了四种燃料、三种推进器,进行射程试验,对于每种燃料与每 种推进器的组合作一次试验,得到试验数据如表 8。问各种燃料之间及各种推进器之间 有无显著差异?

表8火箭试验数其 B B、 B 58.2 56.2 65.3 A、 49.1 54.1 51.6 60.1 70.9 39.2 A 75.8 58.2 48.7 解记燃料为因素A,它有4个水平,水平效应为a,i=1,2,3,4,推进器为因素B 它有3个水平,水平效应为B,j=1,2,3。我们在显著性水平a=0.05下检验 H1:a=a=4==0 H2:B,=B2=B3=0 编写如下的Matlab程序: x=[58.256.2 65.3 40.1 599 75.8 58.2 48.71: p,tt]=anova2(x) 程无若能明:491 0.7387,表明各种燃料和各种推进器之间的差异对于火箭射 列4 火箭使用了4种燃料,3种推进器作射程试验,每种燃料与每种推进器的 组合各发射火箭2次,得到如表9结果。 表9火箭试验数据 B. A 58.2,52.6 56.2,41.2 65.3,60.8 A、 49.1.42.8 54.1.50.5 51.6.48.4 A 60.1,58.3 70.9,73.2 39.2,40.7 75.8.71.5 58.2.51.0 48.7.41.4 试在水平0.05下,检验不同燃料(因素A)、不同推进器(因素B)下的射程是 否有显著差异?交互作用是否显著? 解 编写程序如下: .ea 49.42.8 x1=x0(:,1:2:5):x2=x0(:,2:2:6): for i=1:4 82: end [p,t,st]=anova2(x,2) -22

-222- 表 8 火箭试验数据 B1 B2 B3 A1 58.2 56.2 65.3 A2 49.1 54.1 51.6 A3 60.1 70.9 39.2 A4 75.8 58.2 48.7 解 记燃料为因素 A ,它有 4 个水平,水平效应为αi ,i = 1,2,3,4 。推进器为因素 B , 它有 3 个水平,水平效应为 β j , j =1,2,3。我们在显著性水平α = 0.05 下检验 H1 :α1 = α 2 = α3 = α 4 = 0 H2 : β1 = β 2 = β 3 = 0 编写如下的 Matlab 程序: x=[58.2 56.2 65.3 49.1 54.1 51.6 60.1 70.9 39.2 75.8 58.2 48.7]; [p,t,st]=anova2(x) 求得p=0.4491 0.7387,表明各种燃料和各种推进器之间的差异对于火箭射 程无显著影响。 例 4 一火箭使用了 4 种燃料,3 种推进器作射程试验,每种燃料与每种推进器的 组合各发射火箭 2 次,得到如表 9 结果。 表 9 火箭试验数据 B1 B2 B3 A1 58.2,52.6 56.2,41.2 65.3,60.8 A2 49.1,42.8 54.1,50.5 51.6,48.4 A3 60.1,58.3 70.9,73.2 39.2,40.7 A4 75.8,71.5 58.2,51.0 48.7,41.4 试在水平 0.05 下,检验不同燃料(因素 A )、不同推进器(因素 B )下的射程是 否有显著差异?交互作用是否显著? 解 编写程序如下: clc,clear x0=[58.2,52.6 56.2,41.2 65.3,60.8 49.1,42.8 54.1,50.5 51.6,48.4 60.1,58.3 70.9,73.2 39.2,40.7 75.8,71.5 58.2,51.0 48.7,41.4]; x1=x0(:,1:2:5);x2=x0(:,2:2:6); for i=1:4 x(2*i-1,:)=x1(i,:); x(2*i,:)=x2(i,:); end [p,t,st]=anova2(x,2)

共13页,试读已结束,阅读完整版请下载
刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档