《医学统计学》课程教学资源:第十九章 聚类分析 Clustering Analysis

第十九章 聚类分析 Clustering Analysis
Clustering Analysis 第十九章 聚 类 分 析

判别分析:已知分为若干类的前提下,判 定观察对象的归属。 聚类分析:不知道应分多少类的情况下, 进行探索性分析,对观察对象 依据某些数量特征适当分类。 1指标聚类(R型聚类) 2样品聚类(Q型聚类)
判别分析:已知分为若干类的前提下,判 定观察对象的归属。 聚类分析:不知道应分多少类的情况下, 进行探索性分析,对观察对象 依据某些数量特征适当分类。 1.指标聚类(R型聚类) 2.样品聚类(Q型聚类)

第一节相似条数 聚类分析的关键是如何定义类间的 相似性,如何把相似性数量化
第一节 相似系数 聚类分析的关键是如何定义类间的 相似性,如何把相似性数量化

相似糸数 1.指标聚类: 简单相关系数(定量) EX XiX:-X ∑ XiX.-X 列联系数(定性): C R×C表 Pearson2 X tn 0<C<1
相似系数 1.指标聚类: 简单相关系数(定量): 2 j j 2 i i j j i i ij X X X X X X X X r n C 2 2 列联系数(定性): R×C表Pearson2 0<C<1

相似糸数 2样品聚类: 将n例样品看成是m维空间的n个点,用两 点间距离定义相似系数。 (1)欧氏距离( Euclidean distance) d=E(x-x
2.样品聚类: 将n例样品看成是m维空间的n个点,用两 点间距离定义相似系数。 (1)欧氏距离(Euclidean distance) 2 dij Xi Xj 相似系数

相似糸数 (2)绝对距离( Manhattan distance) 行=y2X:-X (3)明考斯基距离( Minkowski distance)
(2)绝对距离(Manhattan distance) dij Xi Xj q i j q dij X X 相似系数 (3)明考斯基距离(Minkowski distance)

(4)马氏距离( Mahalanobis distance) 相似 数 d;; = XS-1X Xi1-xil 11 12 lm X12-X12 22 2m X《= S= Xim -xir S_,S,…S m2 mm
(4)马氏距离(Mahalanobis distance) dij=X’ S-1 X 相似系数 im jm i2 j2 i1 j1 X X X X X X X= m1 m2 mm 21 22 2m 11 12 1m S S S S S S S S S S=

第二节糸统聚类 1.开始各个样品或指标独为一类; 2.计算各类间相似系数,形成矩阵; 3.将相似系数最大的两类合并成新类; 4.计算新类与其余类间相似系数,形成矩阵; 5.重复第3、4步,直至全部样品或指标并为 类
第二节 系统聚类 1.开始各个样品或指标独为一类; 2.计算各类间相似系数,形成矩阵; 3.将相似系数最大的两类合并成新类; 4.计算新类与其余类间相似系数,形成矩阵; 5.重复第3、4步,直至全部样品或指标并为 一类

糸统聚类 类间相似系数计算 当两类各含一个样品或指标时,两类间相似 系数即两样品或指标间相似系数d1;或r;j 当两类含有两个或以上样品或指标时,两类 间相似系数有多种定义。 Gn、G表示两类,各含n、nn个样品或指标, 共有n×n个相似系数
一 、类间相似系数计算 当两类各含一个样品或指标时,两类间相似 系数即两样品或指标间相似系数dij或rij。 当两类含有两个或以上样品或指标时,两类 间相似系数有多种定义。 Gp、Gq表示两类,各含np、nq个样品或指标, 共有np×nq个相似系数。 系统聚类

糸统聚类 1.最大相似系数法 Dm=Min(a)样品聚类 i∈Gp,j∈Gq rm=Max(rn)指标聚类 G P 2.最小相似系数法 Dm=Max(dn)样品聚类 Gn,j∈G in(rn)指标聚类 i∈G,i∈G
1.最大相似系数法 指标聚类 样品聚类 r r D d ij i G , j G pq ij i G , j G pq Max Min p q p q 2.最小相似系数法 指标聚类 样品聚类 r r D d ij i G , j G pq ij i G , j G pq Min Max p q p q 系统聚类
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 《医学统计学》课程教学资源:绪论 Introduction.ppt
- 《医学统计学》课程教学资源:第二章 计量资料的统计描述.ppt
- 《医学统计学》课程教学资源:第十章 统计表与统计图(10-1)统计表.ppt
- 《医学统计学》课程教学资源:统计复习.ppt
- 《医学统计学》课程教学资源:第十章 统计表与统计图.doc
- 《医学统计学》课程教学资源:第十六章 logistic回归分析.ppt
- 《医学统计学》课程教学资源:第五章 计数资料的统计描述作业参考答案.doc
- 《医学统计学》课程教学资源:第二章 练习题参考答案.doc
- 《医学统计学》课程教学资源:第二章 计量资料的统计描述(2.3)离散趋势的描述.ppt
- 《医学统计学》课程教学资源:第二章 计量资料的统计描述(2.4-2.5)正态分布(Normal distribution)、医学参考值范围的制定.ppt
- 《医学统计学》课程教学资源:第二章 计量资料的统计描述(2.2.2-2.3)集中趋势的描述(续)、第三节、离散趋势的描述.ppt
- 《医学统计学》课程教学资源:第一章 绪论(Medical Statistics)、引言:统计学的定义、研究对象 和作用、第二章、计量资料的统计描述(频数分布、集中趋势的描述).ppt
- 《医学统计学》课程教学资源:第十七章 生存分析(Survival Analysis).ppt
- 《医学统计学》课程教学资源:第二章 统计描述(2.4-2.5)正态分布(Normal distribution)、医学参考值范围的制定.ppt
- 《医学统计学》课程教学资源:第十一章 多因素试验的方差分析(2/2).ppt
- 《医学统计学》课程教学资源:第十一章 多因素试验的方差分析(1/2).ppt
- 《医学统计学》课程教学资源:第四章 多个样本均数比较的方差分析(4.4-4.6)拉丁方设计资料的方差分析、两阶段交叉试验设计与方差分析、多个均数差别的多重比较.ppt
- 《医学统计学》课程教学资源:第四章 多个样本均数比较的方差分析(4-1-4.3)方差分析的基本思想和应用条件、完全随机设计资料的方差分析、随机区组设计资料的方差分析、多样本方差齐性检验.ppt
- 《医学统计学》课程教学资源:总体均数的估计与假设检验练习题.doc
- 《医学统计学》课程教学资源:第三章 总体均数的估计与假设检验.ppt
- 《医学统计学》课程教学资源:第五章 计数资料的统计描述.ppt
- 西安交通大学:《组织学与胚胎学》课程教学资源(PPT课件讲稿)第一章 绪论.ppt
- 西安交通大学:《组织学与胚胎学》课程教学资源(PPT课件讲稿)第二章 上皮组织(Epithelium Tissue).ppt
- 西安交通大学:《组织学与胚胎学》课程教学资源(PPT课件讲稿)第三章 结缔组织(Connective Tissue).ppt
- 西安交通大学:《组织学与胚胎学》课程教学资源(PPT课件讲稿)第四章 软骨和骨(Cartilage Bone).ppt
- 西安交通大学:《组织学与胚胎学》课程教学资源(PPT课件讲稿)第五章 血液.ppt
- 西安交通大学:《组织学与胚胎学》课程教学资源(PPT课件讲稿)第六章 肌组织.ppt
- 西安交通大学:《组织学与胚胎学》课程教学资源(PPT课件讲稿)第七章 神经组织.ppt
- 西安交通大学:《组织学与胚胎学》课程教学资源(PPT课件讲稿)第八章 眼和耳.ppt
- 西安交通大学:《组织学与胚胎学》课程教学资源(PPT课件讲稿)第九章 皮肤.ppt
- 西安交通大学:《组织学与胚胎学》课程教学资源(PPT课件讲稿)第十章 循环系统.ppt
- 西安交通大学:《组织学与胚胎学》课程教学资源(PPT课件讲稿)第十一章 免疫系统.ppt
- 西安交通大学:《组织学与胚胎学》课程教学资源(PPT课件讲稿)第十二章 内分泌系统.ppt
- 西安交通大学:《组织学与胚胎学》课程教学资源(PPT课件讲稿)第十三章 消化管(Digestive tract).ppt
- 《组织胚胎学》课程PPT教学课件讲义.ppt
- 北京大学生命科学学院:《生物伦理学》讲义ppt电子课件(高崇明).ppt
- 《病理解剖学实验》第四讲 修复.ppt
- 《病理解剖学实验》第一讲 组织、细胞的适应和损伤.ppt
- 《病理解剖学实验》第五讲 肿瘤.ppt
- 《病理解剖学实验》第三讲 炎症.ppt