《医学统计学》课程教学课件(PPT讲稿)第三部份 多元统计分析(多元逐步回归)

多元逐步回归 多元线性回归中自变量的确定: ·根据理论知识与经验决定自变量,由于对 部分自变量的作用不确认,借助统计分析 来实现,剔除: (1)对问题的研究可能不重要; (2)可能实际上与其他变量重叠: (3)较大测量误差
多元线性回归中自变量的确定: • 根据理论知识与经验决定自变量,由于对 部分自变量的作用不确认,借助统计分析 来实现,剔除: (1)对问题的研究可能不重要; (2)可能实际上与其他变量重叠; (3)较大测量误差。 多元逐步回归

为何要剔除一部分自变量? 自变量太多,信息成本高,模型复杂,不 易分析理解; ·高度相关的自变量并不增强模型的预测 能力,反而加大回归系数的样本变差, 削弱模型的描述能力
为何要剔除一部分自变量? 自变量太多,信息成本高,模型复杂,不 易分析理解; • 高度相关的自变量并不增强模型的预测 能力,反而加大回归系数的样本变差, 削弱模型的描述能力

多元逐步回归 ·多元逐步回归-从m个自变量中选择K(K≤m) 个自变量,拟合最优或较理想的多元线性回归方 程。 选出的自变量数应: ·足够少:对应变量无重要作用的自变量不能多, 剔除在方程外 ·充分多:对应变量有重要作用的自变量不能少, 保留在方程中
多元逐步回归 • 多元逐步回归-从m个自变量中选择K(K≤m) 个自变量,拟合最优或较理想的多元线性回归方 程。 选出的自变量数应: • 足够少:对应变量无重要作用的自变量不能多, 剔除在方程外 • 充分多:对应变量有重要作用的自变量不能少, 保留在方程中

自变量选择准测 ·残差平方和(SS残)与确定系数(R2) ·残差均方(MS残)与调整确定系数(AdjR2) ·AC信息统计量 ·Cp统计量 ·预测残差平方和PRESS
自变量选择准则 • 残差平方和(SS残)与确定系数(R2) • 残差均方( MS残)与调整确定系数(Adj R2) • AIC信息统计量 • CP统计量 • 预测残差平方和PRESS

残差平方和(SS残) ·残差平方和(SS残)与确定系数(R2) 以某一自变量X被引入模型中导致残差平方 和的改变量评价在此模型条件下X对应变 量影响程度; 引入Xj,SS残减少量多,则X对Y的作用大, 可被引入 剔除Xi, S残增加量多,则Xj对Y的作用大, 不应剔除
残差平方和(SS残) • 残差平方和(SS残)与确定系数(R2) 以某一自变量Xj被引入模型中导致残差平方 和的改变量评价在此模型条件下Xj对应变 量影响程度; 引入Xj,SS残减少量多,则Xj对Y的作用大, 可被引入; 剔除Xj, SS残增加量多,则Xj对Y的作用大, 不应剔除.

确定系数(R2) ·R2=1-SS残/SS总 R2与SS残完全相关,作为选择自变量的准 则时完全与SS残等价
确定系数(R2) • R2 =1-SS残/SS总 R2与SS残完全相关,作为选择自变量的准 则时完全与SS残等价

SS残与R2 ·如具有p个自变量的某一种组合可使: SS残p与含全部(m个)自变量SS残m接近; R2p与R2n接近,则含这p个自变量的方程为 “最优”方程。 但“接近”的标准凭主观确定
SS残与R2 • 如具有p个自变量的某一种组合可使: SS残P与含全部(m个)自变量SS残m接近; R2 P与R2 m接近,则含这p个自变量的方程为 “最优”方程。 但 “接近”的标准凭主观确定

SS残与R2 SS残值小,R2大的模型为较“优”模型。 SS残、R2值的大小与引入自变量个数有关,随自 变量个数的增加SS残减少,R2 缺点: 按$S残值小,R大的原则选择自变量,全部自 变量均引入时的模型为较“优”模型,未起到 选择自变量作用; SS残变化量准则适用于比较具有相同自变量个 数模型优劣的判据,而不适合对变量个数不同 的模型的比较
SS残与R2 SS残值小,R2大的模型为较“优”模型。 SS残、 R2值的大小与引入自变量个数有关,随自 变量个数的增加SS残减少, R2 缺点: 按SS残值小,R2大的原则选择自变量,全部自 变量均引入时的模型为较“优”模型,未起到 选择自变量作用; SS残变化量准则适用于比较具有相同自变量个 数模型优劣的判据,而不适合对变量个数不同 的模型的比较

残差均方(MS残 ·MS残p=SS残p/(n-p-l): 含P个自变量时的MS残 MS残是在SS残准则基础上增加了(n-p-11因 子,随着自变量个数的增加,SS残减少, (n-p-l)同时减少,MS残不一定减低
残差均方( MS残) • MS残P=SS残P /(n-p-1) : 含P个自变量时的MS残 • MS残是在SS残准则基础上增加了(n-p-1 )-1因 子,随着自变量个数的增加,SS残减少, (n-p-1)同时减少, MS残不一定减低

残差均方(MS残) ·模型从无自变量开始,按自变量对Y作用大 小逐渐引入,当对Y作用大的自变量引入时, SS残减少幅度大于(n-p-1)减少幅度,MS残 降低; ·当模型中自变量增加到一定程度,对Y作用 大的自变量已基本引入,再增加自变量, SS残减少幅度小于(n-p-1)减少幅度,MS残 增加
残差均方( MS残) • 模型从无自变量开始,按自变量对Y作用大 小逐渐引入,当对Y作用大的自变量引入时, SS残减少幅度大于(n-p-1)减少幅度,MS残 降低; • 当模型中自变量增加到一定程度,对Y作用 大的自变量已基本引入,再增加自变量, SS残减少幅度小于(n-p-1)减少幅度,MS残 增加
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 《医学统计学》课程教学课件(PPT讲稿)第三部份 多元统计分析(多元线性回归).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第三部份 多元统计分析(多因素分析绪论).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第二部份 科研设计(现场调查设计).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第二部份 科研设计(实验设计方案).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第二部份 科研设计(医学科研设计).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第二部份 科研设计(医学研究设计概述).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第一部份 基本统计(统计方法应用上常见的错误).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第一部份 基本统计(相关与回归).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第一部份 基本统计(单向方差分析).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第一部份 基本统计(统计表与统计图).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第一部份 基本统计(二项分布与泊松分布).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第一部份 基本统计(相对数).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第一部份 基本统计(正态分布与医学参考值范围).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第一部份 基本统计(结论).ppt
- 《医学统计学》课程教学资源(试卷习题)套题6参考答案.doc
- 《医学统计学》课程教学资源(试卷习题)套题6试卷.doc
- 《医学统计学》课程教学资源(试卷习题)套题5参考答案.doc
- 《医学统计学》课程教学资源(试卷习题)套题5试卷.doc
- 《医学统计学》课程教学资源(试卷习题)套题4参考答案.doc
- 《医学统计学》课程教学资源(试卷习题)套题4试卷.doc
- 《医学统计学》课程教学课件(PPT讲稿)第三部份 多元统计分析(聚类分析).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第三部份 多元统计分析(判别分析).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第三部份 多元统计分析(logistic).ppt
- 《医学统计学》课程教学课件(PPT讲稿)第三部份 多元统计分析(logistic回归).doc
- 《医学统计学》课程教学课件(PPT讲稿)第三部份 多元统计分析(变量赋值).doc
- 《医学统计学》课程教学课件(PPT讲稿)第四部份 SAS统计软件包(SAS基础教程).ppt