北京邮电大学信息工程学院:《模式识别导论》课程教学资源(PPT课件讲稿)第六章 聚类分析

第六章聚类分析 §6-1分类与聚类的区别 分类:用已知类别的样本训练集来设计分类 器(监督学习) 聚类(集群):用事先不知样本的类别,而 利用样本的先验知识来构造分类器(无监督 学习)
第六章 聚类分析 • §6-1 分类与聚类的区别 – 分类:用已知类别的样本训练集来设计分类 器(监督学习) – 聚类(集群):用事先不知样本的类别,而 利用样本的先验知识来构造分类器(无监督 学习)

§6-2系统聚类 系统聚类:先把每个样本作为一类,然 后根据它们间的相似性和相邻性聚合 相似性、相邻性一般用距离表示 (1)两类间的距离 1、最短距离:两类中相距最近的两样品间 的距离。 D min ∈O eOg
§6-2 系统聚类 • 系统聚类:先把每个样本作为一类,然 后根据它们间的相似性和相邻性聚合。 • 相似性、相邻性一般用距离表示 • (1)两类间的距离 – 1、最短距离:两类中相距最近的两样品间 的距离。 ij x x Dp q d j q i p = min

2、最长距离:两类中相距最远的两个样本间 的距离。 Dpa= max d, 3、中间距离:最短距离和最长距离都有 片面性,因此有时用中间距离。设01类和o23 类间的最短距离为d12,最长距离为d13,02类的 长度为d23,则中间距离为: 23 12 13 4 上式推广为一般情况: 13
• 2、最长距离 :两类中相距最远的两个样本间 的距离。 • 3、中间距离:最短距离和最长距离都有 片面性,因此有时用中间距离。设ω1类和ω23 类间的最短距离为d12,最长距离为d13,ω 23类的 长度为d23,则中间距离为: •上式推广为一般情况: ij x x Dpq d j q i p = max 2 1 3 2 3 2 1 2 2 0 4 1 2 1 2 1 d = d + d − d 1 2 3 12 d 0 d 23 d 13 d

4=2“2+243+B 其中β为参数, β≤0 重心距离:均值间的距离 5、类平均距离:两类中各个元素两两之间的 距离平方相加后取平均值 D pq P x;∈O q 其中:Nn,样本数,N:样本数 为m,类点;与a类点之间的距离
0 4 1 2 1 2 1 2 1 3 2 3 2 1 2 2 0 = + + 其中 为参数,- d d d d • 4、重心距离:均值间的距离 • 5、类平均距离:两类中各个元素两两之间的 距离平方相加后取平均值 = j q i p p q x x i j p q d N N D 2 1 2 为 类点 与 类点 之间的距离 其中 样本数 样本数 d i j N N i j p q p p q q : : , :

·6、离差平方和: 设N个样品原分q类,则定义第谈类的离差平 方和为: ∑(x1-x)(x-x) 其中x为样品x的均值 N为第类的样本数 离差平方和增量:设样本已分成pO2两类, 若把On0合为o类,则定义离差平方
• 6、 离差平方和: – 设N个样品原分q类,则定义第i类的离差平 方和为: – 离差平方和增量:设样本已分成ωp ,ωq两类, 若把ωp ,ωq合为ωr类,则定义离差平方: ( ) . , ( ) ( ) 1 为第 类的样本数 其中 为样品 的均值 N i x x S x x x x i i j i i i j T i N j i j q i i = − − =

DDa=S-s,+sa) 其中S,S分别为,类于m类的离差平方和 S为类的离差平方和 增量愈小,合并愈合理。 ·(2)系统聚类的算法(略) 例:如下图所示 G6 12345678910 设全部样本分为6类, 2、作距离矩阵D(O)
增量愈小,合并愈合理。 为 类的离差平方和 其中 分别为 类于 类的离差平方和 r r p q p q p q r p q S S S D S S S , , ( ) 2 = − + • (2)系统聚类的算法(略) • 例:如下图所示 • 1、设全部样本分为6类, • 2、作距离矩阵D(0) G3 G1 G2 G5 G4 G6 x

16 491664 254 364 6425811
ω 1 ω 2 ω 3 ω 4 ω 5 ω 2 9 ω 3 1 16 ω 4 49 16 64 ω 5 25 4 36 4 ω 6 64 25 81 1 9

3、求最小元素:31=d64=1 4、把ω1,O3合并O7=(1,3) O406合并o3=(46) 5、作距离矩阵D(1) 7 2 49 16 25 4
• 3、求最小元素: • 4、把ω1 ,ω3合并ω7=(1,3) • ω4 ,ω6合并ω8=(4,6) • 5、作距离矩阵D(1) d31 = d64 =1 ω7 ω2 ω8 ω2 9 ω8 49 16 ω5 25 4 4

6、若合并的类数没有达到要求,转3。 否则停止 ·3、求最小元素: d =d 52 58 4 4、O3,O502合并,O9=(2,5,4,6) 7 10 枝状图
• 6、若合并的类数没有达到要求,转3。 否则停止。 • 3、求最小元素: • 4、ω8 ,ω5 ,ω2合并, ω9 =(2,5,4,6) d52 = d58 = 4 枝状图 1 5 2 3 4 6 7 8 9 10

§6-2分解聚类 分解聚类:把全部样本作为一类,然后 根据相似性、相邻性分解 目标函数两类均值方差 E NNi( 2 x 1-2 N:总样本数,N1:o1类样本数 N2:02类样本数,x12x2:两类均值
§6-2 分解聚类 • 分解聚类:把全部样本作为一类,然后 根据相似性、相邻性分解。 • 目标函数 两类均值方差 ( ) ( ) 1 2 1 2 1 2 x x x x T N N N E = − − N:总样本数, :ω1类样本数 :ω2类样本数, x1, x2 :两类均值 N1 N2
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 北京邮电大学信息工程学院:《模式识别导论》课程教学资源(PPT课件讲稿)第八章 模糊模式识别.ppt
- 北京邮电大学信息工程学院:《模式识别导论》课程教学资源(PPT课件讲稿)第五章 参数估计与非参数估计.ppt
- 北京邮电大学信息工程学院:《模式识别导论》课程教学资源(PPT课件讲稿)第二章 判别函数.ppt
- 北京邮电大学信息工程学院:《模式识别导论》课程教学资源(PPT课件讲稿)第三章 分类器的设计.ppt
- 北京邮电大学信息工程学院:《模式识别导论》课程教学资源(PPT课件讲稿)第七章 句法结构模式识别.ppt
- 北京邮电大学信息工程学院:《模式识别导论》课程教学资源(PPT课件讲稿)第一章 概论(盛立东).ppt
- 燕山大学:《微机原理》课程教学资源(PPT课件)第6章 主存储器.ppt
- 燕山大学:《微机原理》课程教学资源(PPT课件)第5章 处理器总线时序和系统总线.ppt
- 燕山大学:《微机原理》课程教学资源(PPT课件)第3章 8086指令系统.ppt
- 燕山大学:《微机原理》课程教学资源(PPT课件)第2章 IA-32结构微处理器.ppt
- 燕山大学:《微机原理》课程教学资源(讲义)第1章 背景知识.pdf
- 燕山大学:《微机原理》课程教学资源(PPT课件)微处理器简史(概述).ppt
- 《人工神经网络应用及原理》课程教学课件(PPT讲稿)第08讲 自组织竞争人工神经网络.ppt
- 《人工神经网络应用及原理》课程教学课件(PPT讲稿)第07讲 反馈网络.ppt
- 《人工神经网络应用及原理》课程教学课件(PPT讲稿)第06讲 反向传播网络.ppt
- 《人工神经网络应用及原理》课程教学课件(PPT讲稿)第05讲 自适应线性元件.ppt
- 《人工神经网络应用及原理》课程教学课件(PPT讲稿)第04讲 感知器(Perceptron).ppt
- 《人工神经网络应用及原理》课程教学课件(PPT讲稿)第03讲 神经元与网络结构.ppt
- 《人工神经网络应用及原理》课程教学课件(PPT讲稿)第02讲 Matlab与神经网络工具箱.ppt
- 《人工神经网络应用及原理》课程教学课件(PPT讲稿)第01讲 绪论.ppt
- 北京邮电大学信息工程学院:《模式识别导论》课程教学资源(PPT课件讲稿)第四章 贝叶斯决策理论.ppt
- 北京理工大学:《鲁棒控制》课程教学资源(讲义)附录二 矩阵方程及矩阵不等式.pdf
- 北京理工大学:《鲁棒控制》课程教学资源(讲义)附录一 串联及逆系统和LFT的状态空间表达式.pdf
- 北京理工大学:《鲁棒控制》课程教学资源(讲义)Chapter 01 鲁棒控制问题及其数学描述.pdf
- 北京理工大学:《鲁棒控制》课程教学资源(讲义)Chapter 10 区间对象族系统的稳定性半径.pdf
- 北京理工大学:《鲁棒控制》课程教学资源(讲义)Chapter 02 控制系统的内稳定性.pdf
- 北京理工大学:《鲁棒控制》课程教学资源(讲义)Chapter 03 化模型匹配问题为广义距离问题.pdf
- 北京理工大学:《鲁棒控制》课程教学资源(讲义)Chapter 04 Hankel范数模型逼近理论.pdf
- 北京理工大学:《鲁棒控制》课程教学资源(讲义)Chapter 05 四块问题的解.pdf
- 北京理工大学:《鲁棒控制》课程教学资源(讲义)Chapter 06 H∞控制问题的解.pdf
- 北京理工大学:《鲁棒控制》课程教学资源(讲义)Chapter 07 基于H∞优化的鲁棒控制.pdf
- 北京理工大学:《鲁棒控制》课程教学资源(讲义)Chapter 08 多项式族的鲁棒稳定性分析.pdf
- 北京理工大学:《鲁棒控制》课程教学资源(讲义)Chapter 09 区间对象族系统的鲁棒稳定性检验.pdf
- 北京理工大学:《鲁棒控制》课程教学资源(讲义)Chapter 01 鲁棒控制问题及其数学描述.pdf
- 西安交通大学:智能控制概论-智能控制理论与方法_小脑模型连接控制器(CMAC)网络.ppt
- 西安交通大学:智能控制概论-智能控制理论与方法_遗传算法(GA).ppt
- 西安交通大学:智能控制概论-智能控制理论与方法_无监督学习神经元网络.ppt
- 西安交通大学:智能控制概论-智能控制理论与方法_智能控制概论.ppt
- 西安交通大学:智能控制概论-智能控制理论与方法_有监督和BP神经网络.ppt
- 西安交通大学:智能控制概论-智能控制理论与方法_模糊控制的基本原理和方法.ppt