《医学统计学》课程教学资源(SAS相关材料)3 SAS基本统计过程(二)

第五章计数资料的统计描述与推断 关于计数资料的统计推断,最为常用的是FREQ过程。 FEQ过程可以用于两个目的:一是描述分析,产生频 数表和列联表,可简洁地描述数据;二是统计推断,产生 各种统计量,可分析变量间的关系。 该过程主要由下列语句控制: PROC FREQ TABLES request(s); WEIGHT variable; 该过程PROC FREQ语句是必需的,其它语句都是可选的。 SSaS彭城 Slide I
彭斌 Slide 1 关于计数资料的统计推断,最为常用的是 FREQ过程。 FREQ过程可以用于两个目的:一是描述分析,产生频 数表和列联表,可简洁地描述数据;二是统计推断,产生 各种统计量,可分析变量间的关系。 该过程主要由下列语句控制: PROC FREQ TABLES request(s) ; WEIGHT variable; 该过程PROC FREQ语句是必需的,其它语句都是可选的。 第五章 计数资料的统计描述与推断

变 1.PROC FREQ ; 这里的options'常用的有 > Data=SAS-data-set,指定输入数据集名,若省略,则 用最近建立的数据集。 SSaS彭城 Slide 2
彭斌 Slide 2 1. PROC FREQ ; 这里的options常用的有 Data=SAS-data-set,指定输入数据集名,若省略,则 用最近建立的数据集

2.TABLES request(s<option(s)≥: TABLES语句是该过程中非常重要的一条语句。在 一个PROC FREO过程中,可以有任意多个tables语句; 如果没有tables语句,FREQ对数据集中的每个变量 都生成一个单向频数表; 如果tables语句没有任何说明选项(options,FREQ 对tables语句中规定的变量的每个水平将计算频数、累 计频数、占总频数的百分数及累计百分数。 SSaS彭城 Slide 3
彭斌 Slide 3 2. TABLES request(s) ; TABLES语句是该过程中非常重要的一条语句。在 一个PROC FREQ过程中,可以有任意多个tables语句; 如果没有tables语句,FREQ对数据集中的每个变量 都生成一个单向频数表; 如果tables语句没有任何说明选项(options),FREQ 对tables语句中规定的变量的每个水平将计算频数、累 计频数、占总频数的百分数及累计百分数

座 I)在TABLES语句中,用request(s)指定制表要求。这里,可 以是用*连接起来的一个变量或多个变量。在一个TABLES 语句中可以给出任意多个制表要求。 例如: 。Tables a, 对指定变量a产生一个单向频数表; 。Tables a*b;产生以b为列、a为行的二维列联表; 。Tables a*b*c;产生以c列、b为行、a为分层的三维列联 表。这里,按照a的不同取值形成b*c的不同列联表。 。Tables a*(bc);等价于tables a*ba*c; 。Tables(ab)*(cd);等价于tables a*ca*db*cb*d; 。Tables(abc)*d;等价于tables a*db*dc*d; SSaS彭城 Slide 4
彭斌 Slide 4 1) 在TABLES语句中,用request(s)指定制表要求。这里,可 以是用*连接起来的一个变量或多个变量。在一个TABLES 语句中可以给出任意多个制表要求。 例如: 。Tables a; 对指定变量a产生一个单向频数表; 。Tables a*b; 产生以b为列、a为行的二维列联表; 。Tables a*b*c; 产生以c列、b为行、a为分层的三维列联 表。这里,按照a的不同取值形成b*c的不同列联表。 。Tables a*(b c);等价于tables a*b a*c; 。Tables (a b)*(c d);等价于tables a*c a*d b*c b*d; 。Tables (a b c)*d;等价于tables a*d b*d c*d;

2)在TABLES语句的斜杠()后面可以使用如下选 项: > CHISQ:要求进行卡方检验(Chi-Square Test) >Fisher: 要求对大于2×2的表进行Fisher的精确检验; >Agree: 做配对卡方检验; > ALPHA-=p:确定置信区间的水平是100(1-p)%的置信区 间,默认p=0.05; ALL:要求所有由CHⅡSQ、MEASURES和CMH选项给 出的检验和度量; >NOCOL、NOROW、NOPERCENT、NOFREQ 最为常用的选项是CHISQ和FISHER。 SSaS彭城 Slide 5
彭斌 Slide 5 2) 在TABLES语句的斜杠(/)后面可以使用如下选 项: CHISQ:要求进行卡方检验(Chi-Square Test) Fisher:要求对大于2×2的表进行Fisher的精确检验; Agree:做配对卡方检验; ALPHA=p:确定置信区间的水平是100(1-p)%的置信区 间,默认p=0.05; ALL:要求所有由CHISQ、MEASURES和CMH选项给 出的检验和度量; NOCOL、NOROW、NOPERCENT、NOFREQ 最为常用的选项是CHISQ和FISHER

壁 3.WEIGHT variable: 通常每个观测对频数计数的贡献都是1,但当出现WEIGHT语句 时,每个观测对频数计数的贡献为这个观测对应的权数变量的值。 。如果资料是最原始的形式,通常情况下不需要此语句; 。如果资料是以频数的形式出现,则需要该语句。 四格表资料 Data a; Input row col f; Cards; 甲组 74 51 1174 乙组 56 19 1251 2 156 建立SAS数据集,行变量row,列 2219 变量col,行列交叉对应的频数f Run; SSaS彭城 Slide 6
彭斌 Slide 6 3. WEIGHT variable; 通常每个观测对频数计数的贡献都是1,但当出现WEIGHT语句 时,每个观测对频数计数的贡献为这个观测对应的权数变量的值。 。如果资料是最原始的形式,通常情况下不需要此语句; 。如果资料是以频数的形式出现,则需要该语句。 Data a; Input row col f; Cards; 1 1 74 1 2 51 2 1 56 2 2 19 ; Run; + - 甲组 74 51 乙组 56 19 四格表资料 建立SAS数据集,行变量row,列 变量col,行列交叉对应的频数f

Proc freq data=a; Tables row*col: Proc freq data=a; Run; 无weighti语句 Tables row*col; 产生结果如下: Weight f, row col row Run; FrequencyI Frequ Percent Percel 产生结果如下: Row Pct Row PetT Col Pct 11 21 Total Col Pet 11 21 Total 1 1 11 2 11 (74) 511 125 25.001 25.00 50.00 1 37.001 25.501 62.50 50.001 50.001 59.201 40.801 50.001 50.001 156.92 72.861 -✉十-=-一-一+ ”十一 -+ 2 1 11 2 21 56 191 75 25.001 25.001 50.00 28.001 9.501 37.50 50.001 50.001 74.671 25.331 50.001 50.001 43.08127.141 一-一+-+ -十-十 Total 2 2 4 Total 130 70 200 50.00 50.00 100.00 65.00 35.00 100.00 可见,有无weighti语句对结果产生很大的差异,对于该资料, 由于是频数资料,因此一定要加上weighti语句。 SSaS彭城 Slide 7
彭斌 Slide 7 row col Frequency| Percent | Row Pct | Col Pct | 1| 2| Total -+-+-+ 1 | 1 | 1 | 2 | 25.00 | 25.00 | 50.00 | 50.00 | 50.00 | | 50.00 | 50.00 | -+-+-+ 2 | 1 | 1 | 2 | 25.00 | 25.00 | 50.00 | 50.00 | 50.00 | | 50.00 | 50.00 | -+-+-+ Total 2 2 4 50.00 50.00 100.00 row col Frequency| Percent | Row Pct | Col Pct | 1| 2| Total -+-+-+ 1 | 74 | 51 | 125 | 37.00 | 25.50 | 62.50 | 59.20 | 40.80 | | 56.92 | 72.86 | -+-+-+ 2 | 56 | 19 | 75 | 28.00 | 9.50 | 37.50 | 74.67 | 25.33 | | 43.08 | 27.14 | -+-+-+ Total 130 70 200 65.00 35.00 100.00 Proc freq data=a; Tables row*col; Weight f; Run; 产生结果如下: Proc freq data=a; Tables row*col; Run; 产生结果如下: 无weight语句 可见,有无weight语句对结果产生很大的差异,对于该资料, 由于是频数资料,因此一定要加上weight语句

坐 例4-8:频数表的编制 某年某地149名成人脉博资料(次/分)的测定数据如下: 试作频数表。 58646872818168637294796594798371 587565686883 91687372565360706865 607962738880706383736867651037464 70947957537583586967867969817575 745768687177709554686648757089104 79 597167957768596072977786778775 55 836875579374567972666879616085 795897687972718854719468608374 80 7171526373788670848272616888 9472 8475839681 为了编制频数表并作频数分析,首先需要建立一 个数据集,将所有的数据进行分组,然后在此基础上调 用相应的SAS过程(FREQ过程)来达到我们的目的。 S绘出相应的程序: Slide 8
彭斌 Slide 8 例4-8:频数表的编制 某年某地149名成人脉博资料(次/分)的测定数据如下: 试作频数表。 58 64 68 72 81 81 68 63 72 94 79 65 94 79 83 71 58 75 65 68 68 83 91 68 73 72 56 53 60 70 68 65 60 79 62 73 88 80 70 63 83 73 68 67 65 103 74 64 70 94 79 57 53 75 83 58 69 67 86 79 69 81 75 75 74 57 68 68 71 77 70 95 54 68 66 48 75 70 89 104 79 59 71 67 95 77 68 59 60 72 97 77 86 77 87 75 55 83 68 75 57 93 74 56 79 72 66 68 79 61 60 85 79 58 97 68 79 72 71 88 54 71 94 68 60 83 74 80 71 71 52 63 73 78 86 70 84 82 72 61 68 88 94 72 84 75 83 96 81 为了编制频数表并作频数分析,首先需要建立一 个数据集,将所有的数据进行分组,然后在此基础上调 用相应的SAS过程(FREQ过程)来达到我们的目的。 下面给出相应的程序:

季 建立SAS数据集 Data ex49: Input x @@ Cards: 58646872 81 816863 72947965 9479 8371 5875 65 6868 839168 73 72 5653 60 70 6865 607962 738880706383736867651037464 70 94 7957537583586967867969817575 745768687177709554686648757089104 79597167957768596072977786778775 55 83 6875579374567972666879616085 79 58 9768797271885471 946860837480 71 71 5263 7378867084827261688894 72 847583 9681 Run; SSaS彭城 Slide 9
彭斌 Slide 9 建立SAS数据集 Data ex49; Input x @@; Cards; 58 64 68 72 81 81 68 63 72 94 79 65 94 79 83 71 58 75 65 68 68 83 91 68 73 72 56 53 60 70 68 65 60 79 62 73 88 80 70 63 83 73 68 67 65 103 74 64 70 94 79 57 53 75 83 58 69 67 86 79 69 81 75 75 74 57 68 68 71 77 70 95 54 68 66 48 75 70 89 104 79 59 71 67 95 77 68 59 60 72 97 77 86 77 87 75 55 83 68 75 57 93 74 56 79 72 66 68 79 61 60 85 79 58 97 68 79 72 71 88 54 71 94 68 60 83 74 80 71 71 52 63 73 78 86 70 84 82 72 61 68 88 94 72 84 75 83 96 81 ; Run;

坐 利用表达式对 Data ex491; 数据进行分组 int0取整函数 Set ex49; int(1.7)=1 int(5.2)=5 grp=int(x-45)/5)*5+45; int(0.4)=0 Run; 确定起始分组和组距: 组距:5, 起始分组:45·50 grp=intx45)/5)*5+45;语句将每一个脉搏值进行分组,例如脉搏 82,被分入 grp=int(82-45)/5)*5+45=int(7.4)*5+45=80,即80-85组内。 提示:该资料还可以用前面学过的格式实现频数分组。建立格式之后, 在FREQ过程中对原始变量x应用分组格式即可。 SSaS彭城 Slide 10
彭斌 Slide 10 Data ex491; Set ex49; grp=int((x-45)/5)*5+45; Run; int()取整函数 int(1.7)=1 int(5.2)=5 int(0.4)=0 确定起始分组和组距: 组距:5, 起始分组:45 - 50 grp=int((x-45)/5)*5+45; 语句将每一个脉搏值进行分组,例如脉搏 82,被分入 grp=int((82-45)/5)*5+45=int(7.4)*5+45=80,即80-85组内。 提示:该资料还可以用前面学过的格式实现频数分组。建立格式之后, 在FREQ过程中对原始变量x应用分组格式即可。 利用表达式对 数据进行分组
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 《医学统计学》课程教学资源(SAS相关材料)2 SAS基本统计过程(一).pdf
- 《医学统计学》课程教学资源(SAS相关材料)1 SAS基础.pdf
- 《医学统计学》课程教学课件(PPT讲稿)绪论.ppt
- 《医学统计学》课程教学课件(PPT讲稿)统计图表(Statistical Table & Statistical Chart).ppt
- 《医学统计学》课程教学课件(PPT讲稿)相对数(Relative Number)及其应用.ppt
- 《医学统计学》课程教学课件(PPT讲稿)常用概率分布.ppt
- 《医学统计学》课程教学课件(PPT讲稿)假设检验和t检验.ppt
- 《医学统计学》课程教学课件(PPT讲稿)方差分析 Analysis of Variance, ANOVA.ppt
- 《医学统计学》课程教学课件(PPT讲稿)假设检验和t检验.ppt
- 《医学统计学》课程教学课件(PPT讲稿)卡方检验 Chi-square test(x2).ppt
- 《医学统计学》课程教学课件(PPT讲稿)线性相关与回归 Linear Correlation and Regression.ppt
- 《医学统计学》课程教学课件(PPT讲稿)实验设计.ppt
- 《医学统计学》课程教学资源(实验指导)实习四 计数资料的统计推断.ppt
- 《医学统计学》课程教学资源(实验指导)实习五 直线相关与回归.ppt
- 《医学统计学》课程教学资源(实验指导)实习二 计数资料的统计描述及抽样误差与抽样分布.ppt
- 《医学统计学》课程教学资源(实验指导)实习三 计量资料的统计推断.ppt
- 《医学统计学》课程教学资源(实验指导)实习一 基本概念与统计描述.ppt
- 《医学统计学》课程教学资源(实验指导)卫生医学统计学实习指导(重庆医科大学:曾庆、彭斌).pdf
- 《医学统计学》课程理论授课教案.doc
- 《医学统计学》课程教学大纲(供五年制各本科专业使用).doc
- 《医学统计学》课程教学资源(SAS相关材料)4 方差分析.pdf
- 《医学统计学》课程教学资源(SAS相关材料)5 相关与回归分析.pdf
- 《医学统计学》课程教学资源(文献资料)决策树中ID3算法与C4.5算法分析与比较.pdf
- 《医学统计学》课程教学资源(文献资料)非参数bootstrap方法.pptx
- 《医学统计学》课程教学资源(文献资料)Three primary input styles in SAS(三种基本输入方法).ppt
- 《医学统计学》课程教学资源(文献资料)决策树分类算法.ppt
- 《医学统计学》课程教学资源(文献资料)最大似然估计.ppt
- 《医学统计学》课程教学资源(文献资料)灰色关联分析方法.ppt
- 《医学统计学》课程教学资源(文献资料)结构方程模型与SmartPLS软件应用.pptx
- 《医学统计学》课程教学资源(文献资料)非参数bootstrap方法及其MATLAB实现.pdf
- 《医学统计学》课程教学资源(文献资料)统计方法在循证医学中的应用.pptx
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题1(试卷).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题1(答案).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题2(试卷).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题2(答案).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题3(试卷).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题3(答案).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题4(试卷).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题4(答案).doc
- 重庆医科大学:《医学统计学》课程教学资源(试卷习题)医学统计学套题5(试卷).doc