中国高校课件下载中心 》 教学资源 》 大学文库

《概率论与数理统计》课程教学资源(实验指导)8、单因素方差分析模型

文档信息
资源类别:文库
文档格式:DOC
文档页数:7
文件大小:320.5KB
团购合买:点击进入团购
内容简介
《概率论与数理统计》课程教学资源(实验指导)8、单因素方差分析模型
刷新页面文档预览

实验8单因素方差分析模型在科学试验和生产实践中,我们常常需要知道哪几个因素对试验结果的质量有显著影响,并且还需要知道起作用的因素在什么水平时所起的作用大.方差分析就是解决这类问题的一种常用的数理统计方法,具体地讲,它是一种用来对两个以上的等方差的正态均值之间的差异进行检验的统计方法.在假设检验中,我们研究了一个样本的均值与假设的总体均值的差异是否显著的问题我们也研究了两正态总体均值是否相等的问题但是如果需要检验两个以上总体的均值是否相等,上一章所介绍的方法就不再适用了,这需要用方差分析的方法来解决方差分析主要用来检验两个以上样本的平均值差异的显著程度,由此判断样本究竞是否抽自具有同一均值的总体。方差分析对于比较不同生产工艺或设备条件下产量、质量的差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否显著时,是非常有用的,1实验目的学习利用Mathematica求单因素方差分析的方法。提出假设:H。:=2==μ,检验方法如下:如果原假设Hoμ=2==μ成立,由F分布的定义可知,F=S(r-)2~F(r-1,n-r)Se(n-r)如果因素A的各水平对总体的影响有显著差异,那么S,较大,因而F也较大:由此对给定的显著性水平α,从F分布表中查得F(r-1,n-r),拒绝域为:W=P(F>Fa)=α当试验数据使F>F。成立时,说明与相比显著偏大,则在显著性水平α下r-ln-r可以认为因素A对试验结果的影响是显著的,从而拒绝H。:当试验数据使F≤F。成立时,接受H。,即认为因素A对试验结果的影响不显著把计算结果列成表,叫做方差分析表(见表1)表1单因素方差分析表平方和均方F值方差来源自由度F临界值S4S组间SAr-1FSr-1Fa(r-1,n-r)ISESeSSEn-r组内n-

实验 8 单因素方差分析模型 在科学试验和生产实践中,我们常常需要知道哪几个因素对试验结果的质量有显著影 响,并且还需要知道起作用的因素在什么水平时所起的作用大.方差分析就是解决这类问 题的一种常用的数理统计方法.具体地讲,它是一种用来对两个以上的等方差的正态均值 之间的差异进行检验的统计方法. 在假设检验中,我们研究了一个样本的均值与假设的总体均值的差异是否显著的问 题.我们也研究了两正态总体均值是否相等的问题.但是如果需要检验两个以上总体的均 值是否相等,上一章所介绍的方法就不再适用了.这需要用方差分析的方法来解决. 方差分析主要用来检验两个以上样本的平均值差异的显著程度,由此判断样本究竟是 否抽自具有同一均值的总体.方差分析对于比较不同生产工艺或设备条件下产量、质量的 差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否 显著时,是非常有用的. 1 实验目的 学习利用 Mathematica 求单因素方差分析的方法。 提出假设: H0 1= 2 ==r : ,检验方法如下: 如果原假设 H0 1= 2 ==r : 成立,由 F 分布的定义可知, ~ ( 1, ) /( ) /( 1) F r n r S n r S r F E A − − − − = 如果因素A的各水平对总体的影响有显著差异,那么 A S 较大,因而 F 也较大.由此对 给定的显著性水平  ,从 F 分布表中查得 F (r −1, n − r)  ,拒绝域为: W = P{F  F} = 当试验数据使 F  F 成立时,说明 r −1 S A 与 n r SE − 相比显著偏大,则在显著性水平  下 可以认为因素 A 对试验结果的影响是显著的,从而拒绝 H0 ;当试验数据使 F  F 成立时, 接受 H0 ,即认为因素 A 对试验结果的影响不显著. 把计算结果列成表,叫做方差分析表(见表1) 表1 单因素方差分析表 方差来源 平方和 自由度 均方 F 值 F 临界值 组间 A S r −1 A S = r −1 SA F = E A S S F (r −1, n − r)  组内 SE n − r E S = n r SE −

n-1总和ST表中S和S.称为均方误差。由于F观测值的计算比较复杂,所以在实际计算中为了简化运算,通常利用下面的计算公式,---S,=7(7.7)n n,合i=l j=ln1n-Z(X,-X)=Se-Z(7.8)2/in,i=l j=1i=lj=lT-x.TnL-2XUT=ET,=nX其中J=Ii=l j=lS-2(x,-X)-S+Ss-i=l j=l单因素方差分析的计算步骤(1)建立模型,提出假设(2)利用简化公式,计算S和Sg:(3)假设检验,确定假设是否成立,将结果列于表中2基本语句调用线性回归软件包命令<<Statistics\LinearRegression.m,或者输入调用整个统计软件包命令<<Statistics。3典型例题例1下面列出了随机选取的用于计算机的四种类型的电路的响应时间(毫秒)。类型4类型1类型2类型319201618电路的响应时2221152220331819间(毫秒)182726154017考察各种类型电路的响应时间有无显著差异。解这里,试验的指标是电路的响应时间。电路类型为因素,这一因素有四个水平,这是一个单因素试验。试验的目的是为了考察各种类型电路的响应时间有无显著差异。输入命令<<Statisticsms=((19,15,22,20,18),(20,40,21,33,27),(15,16,17,18,26),(18,22,19);下面输入的程序定义了叫做ANOVA1(方差分析1)的命令,符号“="是延迟赋值命令。“Module"是局部变量命令,它的第一个括号内的变量名称只在这一段程序内有效。其他地方对这些变量的赋值或定义不会影响到这里。ANOVAI[data List] :=Module[(dataf,tt,mm,nn,sost,sosa,sose,ppvalue]

总和 T S n −1 表中 A S 和 E S 称为均方误差. 由于 F 观测值的计算比较复杂,所以在实际计算中为了简化运算,通常利用下面的计 算公式. A S == = − r i n j i i X X 1 1 2 ( ) == − r i niXi nX 1 2 2 = = − r i i i n T n T 1 2 2 (7.7) SE == = − r i n j i j i i X X 1 1 2 ( ) =  = = = − r i i i r i n j i j n T X i 1 2 1 1 2 (7.8) 其中 = = ni j Ti Xi j 1 ,T X T nX r i i r i n j i j i = = = =1 =1 =1 T S == = − r i n j i j i X X 1 1 2 ( ) = SA + SE , 单因素方差分析的计算步骤 (1)建立模型,提出假设. (2)利用简化公式,计算 A S 和 SE . (3)假设检验,确定假设是否成立.将结果列于表中. 2 基本语句 调用线性回归软件包命令<<Statistics\LinearRegression.m,或者输入调用整个统计软件包 命令<<Statistics`。 3 典型例题 例 1 下面列出了随机选取的用于计算机的四种类型的电路的响应时间(毫秒)。 电路的响应时 间(毫秒) 类型 1 类型 2 类型 3 类型 4 19 20 16 18 22 21 15 22 20 33 18 19 18 27 26 15 40 17 考察各种类型电路的响应时间有无显著差异。 解 这里,试验的指标是电路的响应时间。 电路类型为因素,这一因素有四个水平, 这是一个单因素试验。 试验的目的是为了考察各种类型电路的响应时间有无显著差异。 输入命令 <<Statistics` ms={{19,15,22,20,18},{20,40,21,33,27},{15,16,17,18,26},{18,22,19}}; 下面输入的程序定义了叫做 ANOVA1(方差分析 1)的命令,符号“:=”是延迟赋值命 令。 “Module”是局部变量命令,它的第一个括号内的变量名称只在这一段程序内有效。 其 他地方对这些变量的赋值或定义不会影响到这里。 ANOVA1[data_List] := Module[{dataf,tt,mm,nn,sost,sosa,sose,ppvalue}

dataf = Flatten[data];tt = Apply[Plus, dataf];mm = Length[data];nn = Length[dataf];sost = Apply[Plus, dataf^2]-tt^2/nn;sosa =Sum[Apply[Plus, data[i]^2/Length[data[i],(j,mm]]-tt^2/nn;sose=sost-sosappvalue=FRatioPValue[sosa*(nn -mm)/sose*(mm -1),mm-1,nn-mm];{ANOVATable->TableForm[(mm-1,sosa,sosa/(mm-1),sosa*(nn-mm)/(sose*(mm-1)),ppvalue[[2]]),(nn-mm,sose,sose/(nn-mm)),(nn-1,sost)),TableHeadings->“"Model","Error","Total"},“"DF","Ss","Meanss","FRatio","PValue"],ppvalue}J//N这就定义了命令ANOVA1,它能对相应的数据集作单因素方差分析。输入ANOVAI[ms]则运行结果为:(ANOVATable ->ssDFMeanssFRatioPValue31.13318× 10-6Model318.978106.3263.76407Error14395.46728.247617Total714.444OneSidedPValue ->1.13318× 10-分析结果表明各种类型电路的响应时间有显著差异。如果再输入别的数据集,ANOVA1也能进行单因素方差分析。例2已知某种商品的价格与日销售量的数据价格(元)1.02.02.02.32.52.62.83.03.33.5销量(kg)5.03.53.02.72.42.52.01.51.212求回归方程,再求价格为4时的日销售量。解(1)求回归方程,绘制散点图和回归直线输入命令data=((1.0,5.0),(2.0,3.5),(2.0,3.0),(2.3,2.7),(2.5,2.4),(2.6,2.5),(2.8,2.0),(3.0,1.5),(3.3,1.2),(3.5,1.2));f=Fit[data, (1,x),x]运行结果6.43828-1.57531x输入命令pd=ListPlot[data, DisplayFunction->Identity] ;fd=Plot[f,(x,-0.3,5),DisplayFunction->Identity]Show[pd,fd,DisplayFunction->sDisplayFunction]运行结果GraphicsOut[U]运行回归方程,下图是散点图和回归直线

dataf = Flatten[data]; tt = Apply[Plus,dataf]; mm = Length[data]; nn = Length[dataf]; sost = Apply[Plus,dataf^2] - tt^2/nn; sosa = Sum[Apply[Plus,data[[j]]]^2/Length[data[[j]]],{j,mm}] - tt^2/nn; sose = sost - sosa; ppvalue = FRatioPValue[sosa*(nn - mm)/sose*(mm - 1),mm - 1,nn - mm]; {ANOVATable ->TableForm[{{mm - 1,sosa,sosa/(mm - 1), sosa*(nn - mm)/(sose*(mm - 1)),ppvalue[[2]]},{nn - mm,sose, sose/(nn - mm)},{nn - 1,sost}}, TableHeadings -> {{"Model","Error","Total"},{"DF","SS", "MeanSS","FRatio","PValue"}}],ppvalue}]//N 这就定义了命令 ANOVA1,它能对相应的数据集作单因素方差分析。 输入 ANOVA1[ms] 则运行结果为: {ANOVATable -> DF SS MeanSS FRatio PValue Model 3 318.978 106.326 3.76407 1.13318 6 10−  Error 14 395.467 28.2476 , Total 17 714.444 OneSidedPValue -> 1.13318 6 10−  } 分析结果表明各种类型电路的响应时间有显著差异。 如果再输入别的数据集,ANOVA1 也能进行单因素方差分析。 例 2 己知某种商品的价格与日销售量的数据: 价格(元) 1.0 2.0 2.0 2.3 2.5 2.6 2.8 3.0 3.3 3.5 销量(kg) 5.0 3.5 3.0 2.7 2.4 2.5 2.0 1.5 1.2 1.2 求回归方程,再求价格为 4 时的日销售量。 解(1)求回归方程,绘制散点图和回归直线 输入命令 data={{1.0,5.0},{2.0,3.5},{2.0,3.0},{2.3,2.7},{2.5,2.4},{2.6,2.5},{2.8,2.0},{3.0,1.5},{3.3,1.2}, {3.5,1.2}}; f=Fit[data,{l,x},x] 运行结果 6.43828-1.57531 x 输入命令 pd=ListPlot[data,DisplayFunction->Identity] ; fd=Plot[f,{x,-0.3,5},DisplayFunction->Identity]; Show[pd,fd,DisplayFunction->$DisplayFunction] 运行结果 Graphics Out[l]运行回归方程,下图是散点图和回归直线

5 fL4.5Y4E3.5-3E2.5上1.522.53.51.5F图!散点图和回归直线(2)预测价格为4时的日销售量输入命令%2/.x4运行结果0.137029即价格为4元时,销量为0.137029千克。(3)应用函数进行分析先调用函数,之后使用Regress求解。(BestFit,ParameterCITable,SummaryReport)]运行结果BestFit-→6.43828-1.57531xSECIEstimate6.438280.236494ParameterCITable1(5.89293,6.98364)-1.575310.0911754+(-1.78556,-1.36506),SEEstimateTStatPValueParameterTable-→16.438280.23649427.22393.57135×10-9-1.575310.0911754-17.27781.28217×10-7XRSquared→0.973901,AdjustedRSquared-→0.970639.EstimatedVariance-0.0397359DFSumOfSqMeanSqPValueFratio111.862111.8621ANOVATable-Model298.5241.28217×10-78Error0.03178870.03973599Total12.183以上生成回归分析报告表,现对上述回归分析报告说明如下:BestFit(最优拟合->6.43828-1.57531x表示一元回归方程为y=6.43828-1.57531x;ParameterCITable(参数置信区间表)中:Estimate这一列表示回归函数中参数a,b的点估计为a=6.43828(第一行),b=-1.57531(第二行);SE这一列的第一行表示估计量a的标准差为0.236494,第二行表示估计量b的标准差为0.0911754:CI这一列分别表示a的置信水平为0.95的置信区间是(5.89293.6.98364b的置信水平为0.95的置信区间是

图 1 散点图和回归直线 (2)预测价格为 4 时的日销售量 输入命令 %2/.x 4 运行结果 0.137029 即价格为 4 元时,销量为 0. 137029 千克。 (3)应用函数进行分析 先调用函数,之后使用 Regress 求解。 {BestFit,ParameterCITable,SummaryReport}] 运行结果 { BestFit→ 6.43828-1.57531x, Estimate SE CI ParameterCITable→1 6.43828 0.236494 {5.89293,6.98364} x -1.57531 0.0911754 {-1.78556,-1.36506}, Estimate SE TStat P Value ParameterTable→1 6.43828 0.236494 27.2239 3.57135×10-9 x -1.57531 0.0911754 -17.2778 1.28217×10-7 RSquared→0.973901,AdjustedRSquared→0.970639,EstimatedVariance→0.0397359, DF SumOfSq MeanSq Fratio PValue ANOVATable→Model 1 11.8621 11.8621 298.524 1.28217×10-7 Error 8 0.0317887 0.0397359 Total 9 12.18 } 以上生成回归分析报告表,现对上述回归分析报告说明如下: BestFit(最优拟合-> 6.43828-1.57531 x 表示一元回归方程为 y = 6.43828−1.57531x ; ParameterCITable(参数置信区间表)中:Estimate 这一列表示回归函数中参数 a ,b 的点估计为 a ˆ = 6.43828(第一行),b = ˆ -1.57531(第二行);SE 这一列的第一行表示估计量 a ˆ 的标准差为 0.236494,第二行表示估计量 b ˆ 的标准差为 0.0911754; CI 这一列分别表示 a ˆ 的 置信水平为 0.95 的置信区间是(5.89293,6.983 64} , b ˆ 的置信水平为 0.95 的置信区间是 1.5 2 2.5 3 3.5 1.5 2.5 3 3.5 4 4.5 5

(-1.78556,-1.36506)。ParameterTable(参数表)中前两列的意义同参数置信区间表,Tstat与Pvalue这两列的第一行表示作假设检验(t检验):H。:a=0;H,:a¥0时,T统计量的观察值为27.2239,检验统计量的P值为3.57135x10-9,这个P值非常小,检验结果强烈地拒绝H。a=0,接受H:a+0第二行表示作假设检验(t检验):H。:b=0H:b+0时T统计量的观察值为-17.2778,检验统计量的P值为1.28217x10-7,这个P值也非常小,检验结果强烈地拒绝H:b=0,接受H:b+0。Rsquared->0.973901,表小R==SSR(回归平方和)=0.973901,它说明的变化有SST(总平方和)97.39%来自x的变化AdjustedRSquared->0.970639,表示修正后的R2=-0.9706390.EstimatedVariance->0.0397359,表示线性模型y=a+bx+,~N(0,)中方差2的估计为0.03973590ANOVATable(回归方差分析表)中的DF这一列为自由度:Model(一元线性回归模型)的自由度为1,Error残差)的自由度为n-2=8,Total(总的)自由度为n-1=9.SumOfSq这一列为平方和:回归平方和SSR=11.8621,残差平方和SSE=0.317887,总的平方和SST=SSR+SSE==12.18;MeanSq这一列是平方和的平均值,由SumOfSq这一列除以对应的DF得到,即MRS= SSR =118621,MSE = SSE=0.03973591n-2MSRFRatio这一列为统计量F=4的值,即F=298.524.最后一列表示统计量F的P值常MSE接近于0因此在作模型参数β(=b)的假设检验(F检验):H。:β=0;H,:β±0时,强烈地拒绝H。:β=0,即模型的参数向量。因此回归效果非常显著。例3今有某种型号的电池三批,它们分别是A,B,C三个工厂所生产的。为评比起质量,各随机抽取5只电池为样品,经试验得其寿命(单位:h)如表1表 1A4042484538B3432302628C3950405043试在显著性水平α=0.05下检验电池的平均寿命有无显著的差异。若差异是显著的,试求均值差μ-μB,μA-Hc及μB-c的置信水平为95%的置信区间。解用回归分析作单因素方差分析完成对模型的假设检验和对模型参数的区间估计任务。输入设计矩阵和数据1=(1.000),100),(100),(100),(10,0),1,1,0)(1,10),(1,10)(1,1)1,1),(10,1),(10,1),(10,(10,1),1,1)Y1=(40,42,48,45,38,26,28,34,32,30,39,50,40,50,43);再输入设计回归命令DesignedRegress[X1,Y1,Regression Report->(ParameterCITable,MeanPredictionCITable,SummaryReport)(*回归报告运行参数的置信区间,均值的置信区间和总结报告*)执行后得到运行CIEstimateSE

(-1.78556,-1.36506)。 ParameterTable(参数表)中前两列的意义同参数置信区间表,Tstat 与 Pvalue 这两列的 第一行表示作假设检验(t 检验): H0 : a = 0 ; H1 : a  0 时,T 统计量的观察值为 27.2239,检 验统计量的 P 值为 3.57135 x 10-9,这个 P 值非常小,检验结果强烈地拒绝 H0 : a = 0 ,接 受 H1 : a  0 ;第二行表示作假设检验(t 检验): H0 : b = 0 ; H1 : b  0 时 T 统计量的观察值为 -17.2778,检验统计量的 P 值为 1.28217x10-7,这个 P 值也非常小,检验结果强烈地拒绝 H0 : b = 0 ,接受 H1 : b  0。 Rsquared->0.973901,表小 0.973901 ( ) ( ) 2 = = 总平方和 回归平方和 SST SSR R ,它说明 y 的变化有 97.39% 来 自 x 的变化 ;AdjustedRSquared->0.970 639 ,表示修正后的 ~2 R =-0.9706390.EstimatedVariance->0.0397359,表示线性模型 , ~ (0, ) 2 y = a + bx +  N  中 方差 2  的估计为 0.0 3973590. ANOVATable(回归方差分析表)中的 DF 这一列为自由度:Model(一元线性回归模型) 的自由度为 1,Error(残差)的自由度为 n-2=8,Total(总的)自由度为 n-1=9.SumOfSq 这一列 为平方和:回归平方和 SSR =11.8 621,残差平方和 SSE = 0.317887,总的平方和 SST = SSR + SSE= =12.18;MeanSq 这一列是平方和的平均值,由 SumOfSq 这一列除以对应的 DF 得 到,即 0.0397359 2 11.8621, 1 = − = = = n SSE MSE SSR MRS FRatio 这一列为统计量 MSE MSR F = 的值,即 F=298.524.最后一列表示统计量 F 的 P 值常 接近于 0. 因此在作模型参数 (= b) 的假设检验(F 检验):H0 :  = 0 ; H1 :   0 时,强烈地拒绝 H0 :  = 0 ,即模型的参数向量。因此回归效果非常显著。 例 3 今有某种型号的电池三批,它们分别是 A,B,C 三个工厂所生产的。 为评比起 质量,各随机抽取 5 只电池为样品,经试验得其寿命(单位:h)如表 1 表 1 A 40 42 48 45 38 B 26 28 34 32 30 C 39 50 40 50 43 试在显著性水平  = 0.05 下检验电池的平均寿命有无显著的差异。 若差异是显著的,试求 均值差 ,  A − B  A −C 及  B −C 的置信水平为 95%的置信区间。 解 用回归分析作单因素方差分析 完成对模型的假设检验和对模型参数的区间估计任务。输入设计矩阵和数据 X1={{1.0,0,0},{1,0,0},{1,0,0},{1,0,0},{1,0,0},{1,1,0},{1,1,0},{1,1,0}, {1,1,0},{1,1,0},{1,0,1},{1,0,1},{1,0,1},{1,0,1},{1,0,1}}; Y1={40,42,48,45,38,26,28,34,32,30,39,50,40,50,43}; 再输入设计回归命令 DesignedRegress[X1,Y1,RegressionReport-> {ParameterCITable,MeanPredictionCITable,SummaryReport}] (*回归报告运行参数的置信区间,均值的置信区间和总结报告*) 执行后得到运行 Estimate SE CI

142.61.89912(38.4622,46.7378)(ParameterCITable->22-12.62.68576-18.4518,-6.7482231.82.68576-4.05178,7.65178)MeanPredictionCITable->SECIObservedPredicted40.42.61.89912[38.4622,46.7378)42.42.61.89912(38.4622.46.737848.42.61.89912(38.4622,46.7378)45.42.61.89912[38.4622,46.7378)38.42.61.89912(38.4622,46.7378)26.30.1.89912(25.8622,34.1378)28.30.1.89912(25.8622,34.1378)30.34.1.89912(25.8622,34.1378)30.32.1.89912(25.8622,34.1378)30.30.1.89912[25.8622,34.1378)39.44.41.89912(40.2622,48.5378)50.44.41.89912(40.2622,48.5378)40.44.41.89912(40.2622,48.5378)50.44.41.89912(40.2622.48.537843.44.41.89912(40.2622,48.5378)SEEstimateTStatPValue1.8991222.43143.63987×10-11142.6-12.6ParameterCITable->22.68576-4.69140.0005219631.82.685760.67020.515421Rsquared->0.739904,AdjustedRSquared->0.696554,EstimatedVariance->18.0333,ANOVATable->DFSumOfsqMeanSqFratioPvalue2Model307.8615.617.0684 0.000309602Error12216.418.033314Total832.从参数置信区间表(ParameterCITable)可知:u4的点估计是42.6,估计量的标准差为1.89912,片,的置信水平为0.95的置信区间是(38.4622,46.7378)。B-μ的点估计是12.6,标准差为2.68576,μB-μ。的置信水平为0.95的置信区间是(-18.4518,-6.74822)Hc-μa的点估计是1.8,标准差为2.68576,Hc-μ,的置信水平为0.95的置信区间是(4.05178,7.65178)从均值置信区间表(MeanPredictionCITable)知:H。的点估计,μ,的置信区间同参数置信区间表,H:的点估计为30.0,置信度为0.95的置信区间是25.8622,34.1378),μc的点估计为44.4,置信度为0.95的置信区间是(40.2622,48.5378)从参数表(ParameterTable)知:关于μB一u是否等于零的假设检验结果是否定的,即μB-μ不等于零。关于μc-μ是否等于零的假设检验结果是不否定原假设,即不否定μc一μ等于零的假设。从Rsquared->0.739904知Y的变化中的74%是由模型引起的,26%是由误差引起的。从EstimatedVariance->18.0333知模型中的误差项的方差的估计是最后从方差分析表知平方和的分解结果是:总的平方和=832.0.模型引起的平方和(效应平方和)=615.6。误差平方和=216.4。作假设检验H-=C-A=OH:-C-不全等于零

1 42.6 1.89912 {38.4622,46.7378} {ParameterCITable->2 -12.6 2.68576 {-18.4518,-6.74822} 3 1.8 2.68576 {-4.05178,7.65178} MeanPredictionCITable-> Observed Predicted SE CI 40. 42.6 1.89912 {38.4622,46.7378} 42. 42.6 1.89912 {38.4622,46.7378} 48. 42.6 1.89912 {38.4622,46.7378} 45. 42.6 1.89912 {38.4622,46.7378} 38. 42.6 1.89912 {38.4622,46.7378} 26. 30. 1.89912 {25.8622,34.1378} 28. 30. 1.89912 {25.8622,34.1378} 34. 30. 1.89912 {25.8622,34.1378} 32. 30. 1.89912 {25.8622,34.1378} 30. 30. 1.89912 {25.8622,34.1378} 39. 44.4 1.89912 {40.2622,48.5378} 50. 44.4 1.89912 {40.2622,48.5378} 40. 44.4 1.89912 {40.2622,48.5378} 50. 44.4 1.89912 {40.2622,48.5378} 43. 44.4 1.89912 {40.2622,48.5378} Estimate SE TStat PValue 1 42.6 1.89912 22.4314 3.63987×10-11 {ParameterCITable->2 -12.6 2.68576 -4.6914 0.00052196 3 1.8 2.68576 0.6702 0.515421 Rsquared->0.739904,AdjustedRSquared->0.696554, EstimatedVariance->18.0333,ANOVATable-> DF SumOfsq MeanSq Fratio Pvalue Model 2 615.6 307.8 17.0684 0.000309602 Error 12 216.4 18.0333 Total 14 832. 从参数置信区间表(ParameterCITable)可知:  A 的点估计是 42.6,估计量的标准差为 1.89912, A 的置信水平为0.95的置信区间是(38.4622,46.7378)。 B − A 的点估计是 12.6, 标准差为 2.68576,  B − A 的置信水平为 0.95 的置信区间是 (−18.4518,−6.74822 ). C − A 的点估计是 1.8,标准差为 2.68576, C −  A 的置信水平为 0.95 的置信区间是 (−4.05178 ,7.65178 ). 从均值置信区间表(MeanPredictionCITable)知:  A 的点估计,  A 的置信区间同参数置 信区间表,  B 的点估计为 30.0,置信度为 0.95 的置信区间是 (25.8622,34.1378),  C 的点估 计为 44.4,置信度为 0.95 的置信区间是 (40.2622,48.5378). 从参数表(ParameterTable)知: 关于  B − A 是否等于零的假设检验结果是否定的,即  B − A 不等于零。 关于 C − A 是否等于零的假设检验结果是不否定原假设,即不否 定 C − A 等于零的假设。 从 Rsquared->0.739904 知 Y 的变化中的 74%是由模型引起的,26%是由误差引起的。 从 EstimatedVariance->18.0333 知模型中的误差项 的方差的估计是 最后从方差分析表知平方和的分解结果是:总的平方和=832.0,模型引起的平方和(效应 平方和)=615.6。 误差平方和=216.4。作假设检验 H  B −  A = C −  A = H  B −  A C −  A : 0; : , 0 1 不全等于零

统计量F的观察值为17.0684,F的P值为0.000309602,检验结果显然否定原假设即三个工厂生产的电池的平均寿命有显著差异。总结起来:三个工厂生产的电池的平均寿命有显著差异。μ一μB的置信水平为0.95的置信区间是(6.74822,18.4518)。μA-μc的置信水平为0.95的置信区间是(7.65178,4.05178)看来只有μB一μc的置信区间未能求得。只要改变设计矩阵X,再作一次设计回归。输入数据X2=((1.0,0,1),(1,0,1),(1,0,1),(1,0,1),(1,0,1),0,1,1),(0,1,1),(0,1,1)(0,1,1),(0,1,1,00,1),(00,1),(00,1),(00,1),0,0,1));输入命令DesignedRegress[X2,Y1,RegressionReport->(ParameterCITable.MeanPredictionCITable.SummaryReport!]就能得到类似于对,J的设计回归结果(运行结果省略了)从参数置信区间表可以得到μB-μc的置信水平为0.95的置信区间是(-20.2518,-8.54822)习题1.为了考察水温(单位:°C)对某种布料的收缩率(单位:%)的影响,在4种不同水温下各作了4次试验,得数据如表2。表2收率水温缩20℃9.58.811.47.840℃6.58.38.68.260°℃10.04.85.49.680℃9.38.97.210.1试问,水温对该种布料的收缩率有无显著影响。3.将抗生素注入人体会产生抗生素与血浆蛋白质结合的现象以致减少了药效。表3中列出了5种常用的抗生素注入到牛的体内时,抗生素与血浆蛋白质结合的百分比。试在水平α=0.05下检验这些百分比的均值有无显著的差异。表3青霉素四环素链霉素红霉素氯霉素29.627.35.821.629.224.332.66.217.432.828.530.811.018.325.032.034.88.319.024.2为单因素方差分析问题

时 统计量 F 的观察值为 17.0684,F 的 P 值为 0.000309602,检验结果显然否定原假设, 即三个工厂生产的电池的平均寿命有显著差异。 总结起来: 三个工厂生产的电池的平均寿命有显著差异。 A − B 的置信水平为 0.95 的置信区间是(6.74822,18.4518)。  A −C 的置信水平为 0.95 的置信区间是 (−7.65178 ,4.05178 ). 看来只有  B −C 的置信区间未能求得。只要改变设计矩阵 X,再作一次设 计回归。 输入数据 X2={{1.0,0,1},{1,0,1},{1,0,1},{1,0,1},{1,0,1},{0,1,1},{0,1,1},{0,1,1}, {0,1,1},{0,1,1},{0,0,1},{0,0,1},{0,0,1},{0,0,1},{0,0,1}}; 输入命令 DesignedRegress[X2,Y1,RegressionReport-> {ParameterCITable,MeanPredictionCITable,SummaryReport}] 就能得到类似于对 1 1 x , y 的设计回归结果(运行结果省略了),从参数置信区间表可以得 到  B −C 的置信水平为 0.95 的置信区间是 (−20.2518,−8.54822 ). 习题 1.为了考察水温(单位: oC)对某种布料的收缩率(单位: %)的影响,在 4 种不同水温下各作了 4 次试验,得数据如表 2。 表 2 水 温 收 缩 率 20oC 9.5 8.8 11.4 7.8 40oC 6.5 8.3 8.6 8.2 60 oC 10.0 4.8 5.4 9.6 80 oC 9.3 8.9 7.2 10.1 试问,水温对该种布料的收缩率有无显著影响。 3.将抗生素注入人体会产生抗生素与血浆蛋白质结合的现象,以致减少了药效。表 3 中列出 了 5 种常用的抗生素注入到牛的体内时,抗生素与血浆蛋白质结合的百分比。 试在水平  = 0.05 下检验这些百分比的均值有无显著的差异。 表 3 青霉素 四环素 链霉素 红霉素 氯霉素 29.6 27.3 5.8 21.6 29.2 24.3 32.6 6.2 17.4 32.8 28.5 30.8 11.0 18.3 25.0 32.0 34.8 8.3 19.0 24.2 为单因素方差分析问题。

已到末页,全文结束
刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档