复旦大学:《卫生统计学》课程教学资源(习题)第十章 直线回归和相关Stata实现

第十章直线回归和相关的 Stata实现 本章使用的 Stata命令为 直线回归 regress应变量自变量 在执行 regress命令后,执行下列命令 残差计算 predict变量名, residual Pearson相关 pacor变量1变量n,sig Spearman相关 spearman变量1变量2 例10-1为了研究血清胆固醇含量与舒张压之间是否存在依存关系,2006 年在郑州某大学随机抽取10名成年男性,测得他们的血清胆固醇(mg/L)含量和 舒张压(mmHg)如表10-1,请作统计分析。 表10-110名成人的血清胆固醇(mgdL)含量和舒张压(mmHg) 指标 2 3 5 6 8 胆固醇X 307259341237254416267320374316 舒张压Y 75 90 75105 85 H0:总体回归方程不成立(月=0) H1:总体回归方程成立(B≠0) Stata数据 307 80 75 2345678 90 416 105 88 316 Stata命令为
第十章 直线回归和相关的 Stata 实现 本章使用的 Stata 命令为: 直线回归 regress 应变量 自变量 残差计算 在执行 regress 命令后,执行下列命令: predict 变量名,residual Pearson 相关 pwcorr 变量 1 … 变量 n, sig Spearman 相关 spearman 变量 1 变量 2 例 10-1 为了研究血清胆固醇含量与舒张压之间是否存在依存关系,2006 年在郑州某大学随机抽取 10 名成年男性,测得他们的血清胆固醇(mg/dL)含量和 舒张压(mmHg)如表 10-1,请作统计分析。 表 10-1 10 名成人的血清胆固醇(mg/dL)含量和舒张压(mmHg) 指标 编 号 1 2 3 4 5 6 7 8 9 10 胆固醇 X 307 259 341 237 254 416 267 320 374 316 舒张压 Y 80 75 90 70 75 105 70 85 88 78 H0 :总体回归方程不成立( = 0 ) H1:总体回归方程成立( 0 ) =0.05 Stata 数据: x y 1 307 80 2 259 75 3 341 90 4 237 70 5 254 75 6 416 105 7 267 70 8 320 85 9 374 88 10 316 78 Stata 命令为: reg y x

结果 Source Number of obs Model928.343132 1928.343132 Prob 0.0000 Residual| 114.05686 814.2571086 R-squared 0.8906 Ij R-squared 0.8769 Total 9115.822222 Coef. Std. Err t p>t [95% Conf. Interval] 17786402204198.070.000 1270352 2286927 cons 26.622256.9169953.850.00510.6716342.5728 t=8.07,P值<0.001( Stata输出值0.000),构建直线回归方程将a和b代入 式(10-2),可知 Y=2662+0.178X 本例中,b的统计学意义为:血清胆固醇含量每增加1mg/dL,总体中舒张 压平均增加0.178mmHg 总体均数A1x的区间估计给定X=X0时,Y的总体均数的点估计,例10 1中,当自变量X取值为307mgdL时。个体Y值的容许区间估计给定X=X 值时,估计总体中个体Y值的波动范围,以例10-1中第一个样本点的数据 (30780)为例 Stata命令: predict yhat predict stdf, stdf generate clml yhat - invttail(7,0.025)*stdp generate clm2 yhat t invttail(7,0.025)*stdp generate clpl yhat -invttail(7,0.025)*stdf generate clp2 yhat invttail(7,0.025)*stdf twoway (lfitci y x, level (95))(scatter y x)(line clml clm2 clpl clp2 x, style(p2p2 p3 p3) sort)
结果: Source | SS df MS Number of obs = 10 -------------+------------------------------ F( 1, 8) = 65.11 Model | 928.343132 1 928.343132 Prob > F = 0.0000 Residual | 114.056868 8 14.2571086 R-squared = 0.8906 -------------+------------------------------ Adj R-squared = 0.8769 Total | 1042.4 9 115.822222 Root MSE = 3.7759 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- x | .177864 .0220419 8.07 0.000 .1270352 .2286927 _cons | 26.62225 6.916995 3.85 0.005 10.67163 42.57287 ------------------------------------------------------------------------------ t=8.07 ,P值<0.001(Stata输出值0.000),构建直线回归方程 将 a 和 b 代入 式(10-2),可知, Y ˆ = 26.62 + 0.178X 本例中, b 的统计学意义为:血清胆固醇含量每增加 1mg/dL,总体中舒张 压平均增加 0.178mmHg。 总体均数 Y X 的区间估计 给定 X X = 0 时, Y 的总体均数的点估计,例 10 -1 中,当自变量 X 取值为 307 mg/dL 时。个体 Y 值的容许区间估计 给定 X X = 0 值时,估计总体中个体 Y 值的波动范围,以例 10-1 中第一个样本点的数据 (307,80)为例。 Stata 命令: predict yhat predict stdp, stdp predict stdf, stdf generate clm1 = yhat - invttail(7,0.025)*stdp generate clm2 = yhat + invttail(7,0.025)*stdp generate clp1 = yhat - invttail(7,0.025)*stdf generate clp2 = yhat + invttail(7,0.025)*stdf twoway (lfitci y x, level(95)) (scatter y x) (line clm1 clm2 clp1 clp2 x, pstyle(p2 p2 p3 p3) sort)

结果 hat stdp stdf cIml clm2 clpl 078081.231.193.9678.484.0571.8690.59 2597572.691.634.1168.8476.5362.9782.41 3419087.271.394.028490.5577.7696.78 2377068.781.994.2764.0873.4858.6978.87 71.81.74.1467.7775.83 416 100.612.644.6194.37106.86 2111.51 2677074.111.514.0770.5477.6964.4983.73 3208583.541.223.9780.6686.4274.1692.92 3748893.141.864.2188.7497.5583.19103.1 3167882.831.23.9679.9885.6773.4692.2 00 350 450 95%c Fitted value y clm 1/clm2 clp1/clp2
结果: x y yhat stdp stdf clm1 clm2 clp1 clp2 307 80 81.23 1.19 3.96 78.4 84.05 71.86 90.59 259 75 72.69 1.63 4.11 68.84 76.53 62.97 82.41 341 90 87.27 1.39 4.02 84 90.55 77.76 96.78 237 70 68.78 1.99 4.27 64.08 73.48 58.69 78.87 254 75 71.8 1.7 4.14 67.77 75.83 62 81.59 416 105 100.61 2.64 4.61 94.37 106.86 89.72 111.51 267 70 74.11 1.51 4.07 70.54 77.69 64.49 83.73 320 85 83.54 1.22 3.97 80.66 86.42 74.16 92.92 374 88 93.14 1.86 4.21 88.74 97.55 83.19 103.1 316 78 82.83 1.2 3.96 79.98 85.67 73.46 92.2 60 70 80 90 100 110 250 300 350 400 450 x 95% CI Fitted values y clm1/clm2 clp1/clp2

例10—2某发热门诊医生根据患者就诊顺序随机抽取12名20~40岁发热 患者,试探讨体温与脉搏之间的伴随关系,数据见表10-4 表10-412名发热患者的体温(℃)与脉搏(次/分) 4 5 7 8 II 体温X41.037.540738438.840.038039039.539840.8396 脉搏Y13585 134 24 106117125130138135 Stata数据 37.5 85 4 5 39 117 39.8 11 40.8 138 12 39.6 135 Stata命令 yx, sig 结果 1.0000 x|0.91731.0000 0.0000 P<00001,体温与脉搏存在线性相关关系
例 10-2 某发热门诊医生根据患者就诊顺序随机抽取 12 名 20~40 岁发热 患者,试探讨体温与脉搏之间的伴随关系,数据见表 10-4。 表 10-4 12 名发热患者的体温(℃)与脉搏(次/分) 指标 编 号 1 2 3 4 5 6 7 8 9 10 11 12 体温 X 41.0 37.5 40.7 38.4 38.8 40.0 38.0 39.0 39.5 39.8 40.8 39.6 脉搏 Y 135 85 134 108 120 124 106 117 125 130 138 135 Stata 数据 x y 1 41 135 2 37.5 85 3 40.7 134 4 38.4 108 5 38.8 120 6 40 124 7 38 106 8 39 117 9 39.5 125 10 39.8 130 11 40.8 138 12 39.6 135 H0: =0 H1: ≠0 = 0.05 Stata 命令: pwcorr y x,sig 结果: | y x -------------+------------------ y | 1.0000 | | x | 0.9173 1.0000 | 0.0000 P<0.0001,体温与脉搏存在线性相关关系

例10一3某医生研究新生儿缺氧缺血性脑病( hypoxic- ischemic cephalopathy,HIE)临床分度与其血浆MDA含量(出生后第7天)的关系, 获得了如下资料,试分析HIE临床分度(1轻度,2中度,3重度)与血浆MDA 含量的相关方向及相关程度。 HE临床分度11 MDA(umol)747.067638.172848.98811.510.610.2110 本例目的在于分析HE临床分度与血浆MDA含量的关系,从数据特征上看, HIE临床分度是等级资料,血浆MDA含量是连续性变量,因此应计算 Spearman 等级相关系数r。 同样地,r是样本相关系数,仅为总体相关系数p的一个点估计,还应做总 体相关系数p是否为0的假设检验,其无效假设与备择假设分别为: Ho: P H1: P Stata数据如下 6 23456789 6.3 87888 2 4 8 11.5 0123 10.6 lI Stata命令如下 spearman y x
例 10 - 3 某医生研究新生儿缺氧缺血性脑病( hypoxic-ischemic encephalopathy,HIE)临床分度与其血浆 MDA 含量(出生后第 7 天)的关系, 获得了如下资料,试分析 HIE 临床分度(1 轻度,2 中度,3 重度)与血浆 MDA 含量的相关方向及相关程度。 HIE 临床分度 1 1 1 1 1 2 2 2 2 3 3 3 3 MDA(umol/L) 7.4 7.0 6.7 6.3 8.1 7.2 8.4 8.9 8.8 11.5 10.6 10.2 11.0 本例目的在于分析 HIE 临床分度与血浆 MDA 含量的关系,从数据特征上看, HIE 临床分度是等级资料,血浆 MDA 含量是连续性变量,因此应计算 Spearman 等级相关系数 s r 。 同样地, s r 是样本相关系数,仅为总体相关系数 s 的一个点估计,还应做总 体相关系数 s 是否为 0 的假设检验,其无效假设与备择假设分别为: H0: s = 0 H1: s ≠0 Stata 数据如下: i x y 1 1 7.4 2 1 7 3 1 6.7 4 1 6.3 5 1 8.1 6 2 7.2 7 2 8.4 8 2 8.9 9 2 8.8 10 3 11.5 11 3 10.6 12 3 10.2 13 3 11 Stata 命令如下: spearman y x

结果 Number of obs Spearman s rho 0.8910 Test of Ho: y and x are independent Prob>tI= 0.0000 P<00001,HE临床分度(1轻度,2中度,3重度)与血浆MDA含量存在 Spearman相关关系
结果: Number of obs = 13 Spearman's rho = 0.8910 Test of Ho: y and x are independent Prob > |t| = 0.0000 P<0.0001,HIE 临床分度(1 轻度,2 中度,3 重度)与血浆 MDA 含量存在 Spearman 相关关系
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 复旦大学:《卫生统计学》课程教学资源(习题)第九章 配伍区组设计资料的统计分析Stata实现.doc
- 复旦大学:《卫生统计学》课程教学资源(习题)第八章 多组独立定量资料的统计分析.doc
- 复旦大学:《卫生统计学》课程教学资源(习题)第七章 两独立样本定量资料的统计分析的Stata实现.doc
- 复旦大学:《卫生统计学》课程教学资源(习题)第五章 参数估计和假设检验Stata实现.doc
- 复旦大学:《卫生统计学》课程教学资源(习题)第二章 统计描述Stata实现.doc
- 复旦大学:《卫生统计学》课程教学资源(习题)卫生统计学Stata实现说明.doc
- 复旦大学:《卫生统计学》理论课教学资源_教学大纲.pdf
- 复旦大学:《概率论》精品课程教学资源(补充习题)第四章 数字特征和特征函数.pdf
- 复旦大学:《概率论》精品课程教学资源(补充习题)第五章 极限定理.pdf
- 复旦大学:《概率论》精品课程教学资源(补充习题)第二章 条件概率与统计独立性.pdf
- 复旦大学:《概率论》精品课程教学资源(补充习题)第三章 随机变量与分布函数.pdf
- 复旦大学:《概率论》精品课程教学资源(电子教案)(第一、二、三、四、五章 极限定理).pdf
- 复旦大学:《概率论》精品课程教学资源(补充习题)第一章 事件与概率.pdf
- 复旦大学:《概率论》精品课程教学资源(补充习题)习题讲解.pdf
- 复旦大学:《概率论》精品课程教学资源(电子教案)第四章 数字特征和特征函数.pdf
- 复旦大学:《概率论》精品课程教学资源(电子教案)第三章 随机变量与分布函数.pdf
- 复旦大学:《概率论》精品课程教学资源(电子教案)第二章 条件概率与统计独立.pdf
- 复旦大学:《概率论》精品课程教学资源(电子教案)第一章 概率论基础知识.pdf
- 复旦大学:《概率论》精品课程教学资源(习题答案)林德贝格-费勒中心极限定理的概率证明 A Probabilistic Proof of the Lindeberg-Feller.pdf
- 复旦大学:《概率论》精品课程教学资源(习题答案)布丰投针问题 Buffon’s needle problem.pdf
- 复旦大学:《卫生统计学》课程教学资源(习题)第十一章 无序分类资料的统计分析Stata实现.doc
- 复旦大学:《卫生统计学》课程教学资源(习题)第十二章 有序分类资料的统计分析Stata实现.doc
- 复旦大学:《卫生统计学》课程教学资源(习题)第十三章 单样本与总体比较的统计分析Stata实现.doc
- 复旦大学:《卫生统计学》课程教学资源(习题)第十四章 生存分析Stata实现.doc
- 复旦大学:《卫生统计学》课程教学资源(习题)第十五章 诊断试验设计与资料分析Stata实现.doc
- 复旦大学:《卫生统计学》课程教学资源(习题)第十六章 析因设计和交叉设计资料分析Stata实现.doc
- 复旦大学:《卫生统计学》课程教学资源(习题)第十七章 多因素回归分析的Stata实现.doc
- 复旦大学:《卫生统计学》课程教学资源_教学试卷(A卷,2013).doc
- 复旦大学:《卫生统计学》课程教学资源(实践课授课课件)Stata软件基本操作和数据分析入门_第1讲 Stata操作入门.pdf
- 复旦大学:《卫生统计学》课程教学资源(实践课授课课件)Stata软件基本操作和数据分析入门_第2讲 统计描述入门.pdf
- 复旦大学:《卫生统计学》课程教学资源(实践课授课课件)Stata软件基本操作和数据分析入门_第3讲 概率分布和抽样分布.pdf
- 复旦大学:《卫生统计学》课程教学资源(实践课授课课件)Stata软件基本操作和数据分析入门_第4讲 两组计量资料平均水平的统计检验.pdf
- 复旦大学:《卫生统计学》课程教学资源(实践课授课课件)Stata软件基本操作和数据分析入门_第5讲 多组平均水平的比较.pdf
- 复旦大学:《卫生统计学》课程教学资源(实践课授课课件)Stata软件基本操作和数据分析入门_第6讲 线性相关和回归.pdf
- 复旦大学:《卫生统计学》理论课程教学资源(PPT授课课件)01 卫生统计学绪论(卫生统计学基本概况和基本概念).ppt
- 复旦大学:《卫生统计学》理论课程教学资源(PPT授课课件)02 定量资料的统计描述(计量资料的统计描述).ppt
- 复旦大学:《卫生统计学》理论课程教学资源(PPT授课课件)03 定性资料的统计描述(分类资料的统计描述).ppt
- 复旦大学:《卫生统计学》理论课程教学资源(PPT授课课件)04 统计图表.ppt
- 复旦大学:《卫生统计学》理论课程教学资源(PPT授课课件)05 常用概率分布(二项分布).ppt
- 复旦大学:《卫生统计学》理论课程教学资源(PPT授课课件)06 常用概率分布——poisson分布.ppt