蚌埠医学院:《多元统计分析》第六章 试验设计与方差分析

第六章试验设计与方差分析 、试验设计初步。 1、试验及其模型; 2、处理设计:单因素试验、多因素试验; 3、试验误差:系统误差、随机误差、错失误差; 4、试验的排列:设置重复、随机化、区组化、拉丁方试验。 二、方差分析一 ANOVA 方差分析( analysis of variance, ANOVA) 在研究一个变量时,能够解决多个总体的均值是否相等的检验问题 在研究多个变量对不同总体的影响时,它也是分析各个自变量对因变量 影响的一种方法。 1.方差分析的内容 首先我们对多个总体均值是否相等这一假设进行检验。 例6.1 某饮料生产企业硏制岀一种新型饮料.饮料的颜色共有四种:橘黄 色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能
第六章 试验设计与方差分析 一、试验设计初步。 1 、试验及其模型; 2 、处理设计:单因素试验、多因素试验; 3 、试验误差:系统误差、随机误差、错失误差; 4 、试验的排列:设置重复、随机化、区组化、拉丁方试验。 二、方差分析 —ANOVA 方差分析( analysis of variance , ANOVA ) 在研究一个变量时,能够解决多个总体的均值是否相等的检验问题; 在研究多个变量对不同总体的影响时,它也是分析各个自变量对因变量 影响的一种方法。 1 .方差分析的内容 首先我们对多个总体均值是否相等这一假设进行检验。 例 6.1 某饮料生产企业研制出一种新型饮料 . 饮料的颜色共有四种 : 橘黄 色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能

影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超市上收 集了该种饮料的销售情况。 该饮料在五家超市的销售情况 超市 无色 粉色 橘黄色 绿色 1 26.5 31.2 27.9 30.8 28.7 28.3 25.1 29.6 25.1 30.8 28.5 29.1 27.9 24.2 31.7 27.2 29.6 26.5 32.8 均值 27.32 29.56 26.44 31.46 进行方差分析 问题:饮料的颜色是否对销售量产生影响 在其他条件相同的情况下,上述问题就归结为一个检验问题,即:检验 饮料颜色对销售量是否有影响 H0:==H3=P4 H:PH2.,H不先全相筝 即
影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超市上收 集了该种饮料的销售情况。 该饮料在五家超市的销售情况: 超市 无色 粉色 橘黄色 绿色 1 2 3 4 5 26.5 28.7 25.1 29.1 27.2 31.2 28.3 30.8 27.9 29.6 27.9 25.1 28.5 24.2 26.5 30.8 29.6 32.4 31.7 32.8 均值 27.32 29.56 26.44 31.46 进行方差分析: 问题:饮料的颜色是否对销售量产生影响? 在其他条件相同的情况下,上述问题就归结为一个检验问题,即:检验 饮料颜色对销售量是否有影响? 即:

2.方差分析的原理 从方差分析的目的看,是要检验四种颜色的饮料的销售均值是否相等, 我们可用方差比较的方法来判断 首先,四种颜色的销售情况可看作为分为四个组 组内平均数组内平方和SsA 组间平方和SSE 颜色 ∑2-x ∑(x-对 无色 27.32 10.688 粉色 29.56 8.572 橘黄色 26.44 13.192 68455 绿色 31.46 6.632 合计 39084 总平方和SST ∑(x-x =1T5.9295 由此可知:差异的产生来自两个方面 方面是由不同颜色的差异造成的,既不同的饮料颜色对销售量产生了 影响 另一方面是由于抽选样本的随机性而产生的差异,即各颜色内的随机误 差,如相同颜色的饮料在不同的商场销售量也不同。 这两个方面产生的差异可以用两个方差来计量
2 .方差分析的原理 从方差分析的目的看,是要检验四种颜色的饮料的销售均值是否相等, 我们可用方差比较的方法来判断。 首先,四种颜色的销售情况可看作为分为四个组: 颜色 组内平均数 组内平方和 SSA 组间平方和 SSE 无色 27.32 10.688 76.8455 粉色 29.56 8.572 橘黄色 26.44 13.192 绿色 31.46 6.632 合计 - 39.084 总平方和 SST 由此可知:差异的产生来自两个方面: 一方面是由不同颜色的差异造成的,既不同的饮料颜色对销售量产生了 影响 另一方面是由于抽选样本的随机性而产生的差异,即各颜色内的随机误 差,如相同颜色的饮料在不同的商场销售量也不同。 这两个方面产生的差异可以用两个方差来计量:

一个称为水平之间(组间)差(组间平方和除以自由度(r 组数),一个称为水平内部(组内)方差(组内平方和除以自由度(n-1),n 为样本容量总数 水平之间的方差既包括系统性因素,也包括随机性因素;水平内部方差 仅包括随机性因素。如果不同的水平(饮料颜色)对结果没有影响,那么在水平 之间的方差中,就仅仅有随机因素的差异,而没有系统性差异,它与水平内部方 差就应该近似,从而应有 水平之而紅问)的方姜 水平内部狐而)方葚 即,两个方差的比值就会接近于1。反之,水平之间的方差就会大于 水平内的方差,当这个比值达到某个程度,或者说达到某临界点,就可做出判断 既不同的水平之间存在着显著差异。 因此,方差分析就是通过不同方差的比价,做出拒绝原假设或不能拒绝 原假设的判断。 F=平之严血河者丢→F(r-1,n一r)分布 水平内敏h基 水平间的方差和水平内方差之比是一个统计量,这个统计量服从F分 布
一个称为水平之间(组间)方差 ( 组间平方和除以自由度 (r-1) ,r 为 组数 ) ,一个称为水平内部(组内)方差(组内平方和除以自由度( n-1) , n 为样本容量总数)。 水平之间的方差既包括系统性因素,也包括随机性因素;水平内部方差 仅包括随机性因素。如果不同的水平(饮料颜色)对结果没有影响,那么在水平 之间的方差中,就仅仅有随机因素的差异,而没有系统性差异,它与水平内部方 差就应该近似,从而应有: 即,两个方差的比值就会接近于 1 。反之,水平之间的方差就会大于 水平内的方差,当这个比值达到某个程度,或者说达到某临界点,就可做出判断, 既不同的水平之间存在着显著差异。 因此,方差分析就是通过不同方差的比价,做出拒绝原假设或不能拒绝 原假设的判断。 水平间的方差和水平内方差之比是一个统计量,这个统计量服从 F 分 布:

3.方差分析的种类 单因素的方差分析 ne-Way ANOVA 分析一个变量时 多因素的方差分析 Univariate 分析多个变量时,称为多元方差分析 Multivariate 4.应用方差分析的条件 各组的观察数据,要看作是从服从正态分布的总体随机抽取的样本 各组的观察数据,是从具有相同方差的相互独立的总体中抽取得到的 一元单因素方差分析 例6.1中有一个变量和一个因素,即:变量 dependent variable 饮料的销售量;因素 factor:饮料的颜色。 用Spss处理数据 spss数据:饮料的颜色 spss选项: Analyze- Compare Mean- One-Way ANOVA SPSS输出结果:
3 .方差分析的种类 分析多个变量时,称为多元方差分析 Multivariate 4 .应用方差分析的条件 各组的观察数据,要看作是从服从正态分布的总体随机抽取的样本; 各组的观察数据,是从具有相同方差的相互独立的总体中抽取得到的。 三、一元单因素方差分析 例 6.1 中有一个变量和一个因素,即:变量 dependent variable : 饮料的销售量;因素 factor :饮料的颜色。 用 Spss 处理数据: Spss 数据:饮料的颜色 Spss 选项: Analyze — Compare Mean — One-Way ANOVA SPSS 输出结果:

ANOVA 销售情况 Sum of Squares Mean Square Between Groups 76.846 3 25.615 10.486 000 Within Groups 39084 2.443 Total 115.929 19 SPSS单因素方差分析的进一步分析 SpSs单因素方差分析的前提检验 由于方差分析的前提是各水平下的总体服从方差相等的正态分布。其 中,正态分布的要求不是很严格,但对于方差相等的要求是比较严格的,因此, 我们有必要对方差分析的前提进行检验。检验的方法是: Homogeneity-of Varlance spss选项:在 One -Way aNOVA中选择 Option,选定 Homogeneity-of- varlance即可。 spSs输出结果 Test of Homogeneity of variances 销售情况 如mm 282 168381 spss单因素方差分析的多重比较检验 通过上面的检验我们只能判断控制变量的不同水平是否对观察变量产 生了显著影响。我们还想进一步了解:究竟是哪一个水平对观察变量产生了显著
SPSS 单因素方差分析的进一步分析 Spss 单因素方差分析的前提检验 由于方差分析的前提是各水平下的总体服从方差相等的正态分布。其 中,正态分布的要求不是很严格,但对于方差相等的要求是比较严格的,因此, 我们有必要对方差分析的前提进行检验。检验的方法是: Homogeneity-of -variance Spss 选项:在 One-Way ANOVA 中选择 Option ,选定 Homogeneity-of –variance 即可。 Spss 输出结果: Spss 单因素方差分析的多重比较检验 通过上面的检验,我们只能判断控制变量的不同水平是否对观察变量产 生了显著影响。我们还想进一步了解:究竟是哪一个水平对观察变量产生了显著

影响,即那种颜色的饮料对销售量有显著影响。这就是单因素方差分析的多重比 较检验。检验结果输出如下 Dependent variable:销售情况 95% Confidence interval 颜色(J颜色 Std erro 2.24000 98848 4.3355 1445 3.00 880098848 387 -1.2155 2.9755 -414000*98848 6.2355 -2.0445 2.00100 2.24000*98848 1445 4.3355 3.00 31200098848 006 1.0245 5.2155 98848 -39955 3.00 00 -80098848 387 -29755 1.2155 2.00 -3.1200098848 006 -5.2155 -1.0245 4.00 502000 2.9245 4.00 414000*98848 001 2.0445 6.2355 2.00 190000 98848 073 3.9955 3.00 2.9245 The mean difference is significant at the 05 level 四、一元多因素方差分析 1、只考虑主效应的方差分析 2、考虑交互效应的方差分析; 3、考虑多变量的方差分析 4、协方差分析。 例62 某商家有如下的数据,研究这个问题的主要目的是看销售额是否受到促 销方式、售后服务和奖金这三个自变量的影响,以及怎样的影响
影响,即那种颜色的饮料对销售量有显著影响。这就是单因素方差分析的多重比 较检验。检验结果输出如下: 四、一元多因素方差分析。 1 、只考虑主效应的方差分析; 2 、考虑交互效应的方差分析; 3 、考虑多变量的方差分析; 4 、协方差分析。 例 6.2 某商家有如下的数据,研究这个问题的主要目的是看销售额是否受到促 销方式、售后服务和奖金这三个自变量的影响,以及怎样的影响

Dependent variable因变量:销售额 Factor因素:促销方式、售后服务 Covariate协变量:奖金 数据文件: Sales.sav 促销方式 售后服务 销售额 奖金 无(0) 无(0) 23.00 2.00 无(0) 无(0) 19.00 1.50 无(0) 无(0) 17.00 2.00 无(0) 无(0) 26.00 2.10 无(0) 有(1) 28.00 1.50 无(0) 有(1) 23.00 1.20 无(0) 有(1) 24.00 1.60 无(0) 有(1) 30.00 1.80 被动促销(1) 无(0) 26.00 1.80 被动促销(1) 无(0) 被动促销(1) 无(0) 20 被动促销(1) 无(0) 2.10 被动促销(1 有(1) 36 2.10 被动促销(1) 有(1) 28.00 1.21 被动促销(1) 有(1) 30.00 1.91 被动促销(1) 有(1) 主动促销(2) 无(0) 主动促销(2) 无(0) 23.00 主动促销(2) 无(0) 25 1.30 主动促销(2) 无(0) 32.00 192 主动促销(2) 有(1) 48.00 1.70 主动促销(2) 有(1 40.00 主动促销(2) 有(1) 41.00 1.20 主动促销(2) 有(1) 46.00 1.81 当有两个或两个以上因素,进行方差分析时,不仅要考虑每个因素的主效 应,往往还要考虑因素与因素之间的交互效应
Dependent variable 因变量:销售额 Factor 因素:促销方式、售后服务 Covariate 协变量:奖金 数据文件: Sales.sav 当有两个或两个以上因素,进行方差分析时,不仅要考虑每个因素的主效 应,往往还要考虑因素与因素之间的交互效应

主效应就是每个因素对因变量的单独影响而交互效应是当两个或更多 的因素的某些水平同时出现时除了主效应之外的附加影响 1.只考虑主效应的方差分析 首先假定自变量受到的仅仅有不同因素的主效应( main effect)而 没有交互效应( Interaction)和协变量的影响 即 因变量=因素A主效应+因素B的主效应+随机误差项 销售额=促销方式+售后服务+随机误差项 以例6.2来说,当只考虑主效应时,假定主动促销比被动促销可以多 产生8万元效益,而有售后服务比没有售后服务多产生9万元效益。那么在 没有交互作用时,同时采取主动促销和售后服务会产生8+9=17万元的 效益(称为可加的) 但如果存在交互效应,那么同时采取主动促销和售后服务会产生一个附 加的效应即交互效应(一般来说也可能是正面的,也可能是负面的),这时的总 效应就不是17万元了 用Spss处理数据 Spss itLi: Analyze- Gereral Linear Model- Univariate 选择效应分析:M。 del- custom- Main effect
主效应就是每个因素对因变量的单独影响,而交互效应是当两个或更多 的因素的某些水平同时出现时除了主效应之外的附加影响。 1 .只考虑主效应的方差分析 首先假定自变量受到的仅仅有不同因素的主效应( main effect )而 没有交互效应( interaction )和协变量的影响。 即: 因变量 = 因素 A 主效应 + 因素 B 的主效应 + 随机误差项 销售额 = 促销方式 + 售后服务 + 随机误差项 以例 6.2 来说,当只考虑主效应时,假定主动促销比被动促销可以多 产生 8 万元效益,而有售后服务比没有售后服务多产生 9 万元效益。那么在 没有交互作用时,同时采取主动促销和售后服务会产生 8 + 9 = 17 万元的 效益(称为可加的)。 但如果存在交互效应,那么同时采取主动促销和售后服务会产生一个附 加的效应即交互效应(一般来说也可能是正面的,也可能是负面的),这时的总 效应就不是 17 万元了。 用 Spss 处理数据: Spss 选项: Analyze— Gereral Linear Model — Univariate 选择效应分析: Model— custom— Main effect

sts of Between - Suh bjects]Effects Dependent Variable: sales Type Ill Sum of Squares df Mean S Corrected Model 11112923 37043117752 000 Intercept 20358375 20358375975641 579.250 289625 13880 00 serice 532042 53204225497 000 Error 17.333 20 21887.000 a R Squared=. 727(Adjusted R Squared= 686) SpSs主效应输出结果 Estimated Marginal Means of SALES SERVICE 没有交互作用的模型可以从下面点图中直观看出。图中下面一条折线连接 了没有售后服务时三种促销状况的销售均值而上面一条连接了有售后服务时 种促销状况的销售均值。由于模型选择为无交互作用,所以这两条线是平行的。 从该图可以看出,两个因子效应综合效应是简单的加法 考虑交互效应的方差分析
Spss 主效应输出结果: 没有交互作用的模型可以从下面点图中直观看出。图中下面一条折线连接 了没有售后服务时三种促销状况的销售均值,而上面一条连接了有售后服务时三 种促销状况的销售均值。由于模型选择为无交互作用,所以这两条线是平行的。 从该图可以看出,两个因子效应综合效应是简单的加法。 2 .考虑交互效应的方差分析
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 蚌埠医学院:《多元统计分析》第六讲 方差分析.doc
- 蚌埠医学院:《多元统计分析》第五讲 数据的收集.doc
- 蚌埠医学院:《多元统计分析》第三章 数据的描述.doc
- 蚌埠医学院:《多元统计分析》第七章 对应分析.ppt
- 蚌埠医学院:《多元统计分析》第三讲 多元统计理论基础.ppt
- 蚌埠医学院:《多元统计分析》(双语版) 第二讲 多元统计分析理论基础.ppt
- 蚌埠医学院:《多元统计分析》第一讲 多元统计分析.ppt
- 蚌埠医学院:《多元统计分析》(双语版) I Univariate versus Multivariate Analysis.ppt
- 蚌埠医学院:《多元统计分析》多元正态分布统计推断.ppt
- 蚌埠医学院:《多元统计分析》第二章 均值向量和协方差阵的检验.ppt
- 蚌埠医学院:《多元统计分析》第六章 因子分析.ppt
- 蚌埠医学院:《多元统计分析》第四章 判别分析.ppt
- 蚌埠医学院:《多元统计分析》(英文版) Chapter 7 Discriminant Analysis.ppt
- 蚌埠医学院:《多元统计分析》第五章 主成分分析.ppt
- 蚌埠医学院:《多元统计分析》(英文版) Chapter 5 Principal Components Analysis (PCA).ppt
- 蚌埠医学院:《多元统计分析》文章及修改说明.doc
- 麻省理工学院:《应用统计学》课程教学资源(讲义)讲义.pdf
- 郑州大学:《统计学》课程教学资源(PPT课件讲稿)总量指标课件.ppt
- 郑州大学商学院:《统计学》综合指数(肖战峰).ppt
- 郑州大学:《统计学》课程教学资源(教案讲义)第六章 统计指数 Statistical Index.doc
- 蚌埠医学院:《多元统计分析》(英文版) Chapter 9 Cluster analysis.ppt
- 蚌埠医学院:《多元统计分析》第三章 聚类分析.ppt
- 蚌埠医学院:《多元统计分析》第四讲 多元统计分析.doc
- 蚌埠医学院:《多元统计分析》重点二.doc
- 蚌埠医学院:《多元统计分析》重点一.doc
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第一章 绪论 §1 抽样调查的概念和作用.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第一章 绪论 §2 抽样调查中的几个基本概念 §3 抽样调查的组织形式及调查方法.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第一章 绪论 §4 抽样调查的设计.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第二章 概率与概率分布 §1 概率的概念.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第二章 概率与概率分布 §5 调查员素质 §6 数据处理与调查总结报告.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第二章 概率与概率分布 §3 问卷设计(一).ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第二章 概率与概率分布 §7 若干数学准备.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第八章 整群抽样 §1 群大小相等的整群抽样 §2 群大小不等的整群抽样.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第九章 二阶与多阶抽样 §1 初级单元大小相等的二阶抽样 §2 初级单元大小不等的二阶抽样 §3 三阶及多阶抽样.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第六章 二重抽样 §1 二重抽样简述 §2 二重分层抽样.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第六章 二重抽样 §3 二重抽样的比估计与回归估计 §4 二重抽样样本量的最优分配.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第七章 不等概率抽样 §1 放回的不等概率抽样 §2 不放回的不等概率抽样.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第三章 简单随机抽样 §1 简单随机抽样及实施方法 §2 总体平均数与总和的估计 §3 估计量的方差及其估计.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第三章 简单随机抽样(3-4)百分数的估针及其误差 §4 百分数的估计及其误差 §5 样本容量n的确定.ppt
- 《抽样调查理论与方法》课程教学资源(PPT课件讲稿)第十二章 非抽样误差 §1 抽样方案及抽样框引起的非抽样误差 §2 无回答现象 §3 计量误差 §4 敏感性问题的调查.ppt