北京大学:《模式识别》课程教学资源(课件讲稿)非监督学习方法(第二部分)

第八章 非监督学习方法 2010.12.20
第八章 非监督学习方法 2010.12.20

2 近邻函数准则算法 近邻函数:如y:是y的第I个近邻,则y:对y 的近邻系数为I;如y是y:的第K个近邻,则y 对y的近邻系数为K;y,和y;之间的近邻函数: a=I+K-2,i≠;&m=2N; 口连接:如y,和y,被分到同一类,则相互连接; 连接损失:两点之间的近邻函数a 如两点不 同类,则损失为0: NN 总类内损失:Lmn=∑∑a, i=1 i=l
2 近邻函数准则算法 近邻函数:如 yi是 yj的第 I 个近邻,则 yi对 yj 的近邻系数为 I;如 yj 是 yi 的第 K 个近邻,则 yj 对 yi 的近邻系数为 K;yi和 yj之间的近邻函数: 连接:如 yi 和 yj 被分到同一类,则相互连接; 连接损失:两点之间的近邻函数αij ;如两点不 同类,则损失为 0; 2, ; 2 ; ij ii I K i j N 1 1 . N N within ij i j L 总类内损失:

3 近邻函数准则算法 y为 损失 `w"W w2 w1 Vi yk 损失:0k=1+6-2=5,0x=2+1-2=1
3 近邻函数准则算法 损失: ik ij ;1212,5261

4 近邻函数准则算法 两类间的最小近邻函数:方m (a)月 口w与其余各类的最小近邻函数:=in': j≠1 ▣类间损失 -[(y:-aims)-(:-agmas)if 总类间损失: Yi>akimax if Y,≤1max,Y>Ck ma Yi+akmax ifY,>C1max,Y,≤k max =∑A; Yi+aimax +ak max ifY≤amax,Y1≤0 max i=1 其中Cmax、Ckmax是同一类中样本间的最大连接损失
4 近邻函数准则算法 两类间的最小近邻函数: ωi 与其余各类的最小近邻函数: 类间损失 , min ; k il j ij ij y y 1, , min ; i ij j c j i =1 ; c between i i L 总类间损失:

5 近邻函数准则算法 口算法步骤 1.计算距离矩阵△,其元素△=△(yy,)月 2.用距离矩阵计算近邻矩阵M,M表示y:是y的 第几个近邻; 3计算近邻函数矩阵L,L,M,+M-2L,L2N: 4.搜索L,连接每个点与其最近邻形成初始划分; 5.对每两个类计算Y和imax? jmax' 只要Y,小 于imax' a: imax 中的任何一个,就合并两类(建 立连接)。重复至没有新的连接为止
5 近邻函数准则算法 算法步骤 1. 计算距离矩阵 ∆,其元素 2. 用距离矩阵计算近邻矩阵 M , Mij 表示 yi 是 yj 的 第几个近邻; 3. 计算近邻函数矩阵 L , Lij = Mij + Mji –2 I , Lii =2 N; 4. 搜索 L,连接每个点与其最近邻形成初始划分; 5. 对每两个类计算γij 和αimax,αjmax,只要γij 小 于αimax,αjmax中的任何一个,就合并两类(建 立连接)。重复至没有新的连接为止。 );,( ij yy ji

分级聚类方法
分级聚类方法

7 两种策略 y2 Ya y1 yo ys ya 1-水平- 100 2-水平- 3-水平- 90 4-水平- 80 5-水平- 70 性 y1,y2,y3,y4y5 6-水平 y1,y2,y3 y4,y5 y1,y2 ys y
7 两种策略

8 类间相似性度量 口最近距离(single--link): A(T,「y)=min8(x,y), yerj 口最远距离(complete--link): A(rir)=max6(x,y), yerj 口均值距离(average-link): △(T,Tj)=6(m,mj)
8 类间相似性度量 最近距离(single-link): 最远距离(complete-link): 均值距离(average-link): ( , ) min ( , ), i j i j x y x y ( , ) max ( , ), i j i j x y x y ( , ) ( , ). ij i j m m

9 类间相似性度量对结果的影响 Single-Link Single-Link Method ab C d Euclidean Distance (1) (2) (3) b d b d d d a 2 6 5 6 a,bi 3) a,b,c 4 3 b 4 c 4 c Distance Matrix Complete-Link Method Complete-Link Euclidean Distance ab ca (1) (2) (3) b d b d C d c.d 3 5 654 a 53 65 a,b 56 a,b6 4 4 c y Distance Matrix
9 类间相似性度量对结果的影响

10 类间相似性度量对结果的影响 0 0 0 0 0 0 00 0 (a) 。0 0 0 00 0 0 0 0 0 00 0 0 (b) (6) 0 0 0 000 0 (c) (c) (c) 三种数据分布的例子 采用最近距离作为相似性度量 采用最远距离作为相似性度量
10 类间相似性度量对结果的影响
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 北京大学:《模式识别》课程教学资源(课件讲稿)非监督学习方法(第一部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)特征的选择和提取(第三部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)特征的选择和提取(第二部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)特征的选择和提取(第一部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)非线性判别和函数.pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)近邻法(甘锐、金文马).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)贝叶斯决策理论(第二部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)贝叶斯决策理论(第三部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)贝叶斯决策理论(第一部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)线性判别函数(第四部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)线性判别函数(第二部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)线性判别函数(第三部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)线性判别函数(第一部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)概率密度函数的估计(第二部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)概率密度函数的估计(第三部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)概率密度函数的估计(第一部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)模式识别引论(第二部分).pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)模式识别引论(第一部分).pdf
- 电子科技大学:《漫画数学建模》课程教学资源(电子教案).pdf
- 电子科技大学:《漫画数学建模》课程教学资源(课件讲稿)第十章 模型的分析与评价.pdf
- 北京大学:《模式识别》课程教学资源(课件讲稿)人工神经网络简介.pdf
- 《模式识别》课程教学资源(书籍文献)Digital Image Processing(Second Edition,Review Material,Rafael C. Gonzalez、Richard E. Woods).pdf
- 《模式识别》课程教学资源(书籍文献)Statistical Pattern Recognition - A Review.pdf
- 《模式识别》课程教学资源(书籍文献)Tutorial on maximum likelihood estimation.pdf
- 《模式识别》课程教学资源(书籍文献)Background and Foreground Modeling Using Nonparametric Kernel Density Estimation for Visual Surveillance.pdf
- 《模式识别》课程教学资源(书籍文献)TRENDS & CONTROVERSIES TRENDS & CONTROVERSIES - Support vector machines.pdf
- 《模式识别》课程教学资源(书籍文献)Introduction to Support Vector Learning.pdf
- 《模式识别》课程教学资源(书籍文献)A Tutorial on Support Vector Machines for Pattern Recognition(CHRISTOPHER J.C. BURGES).pdf
- 《模式识别》课程教学资源(书籍文献)Sequential Minimal Optimization - A Fast Algorithm for Training Support Vector Machines(John C. Platt).pdf
- 《模式识别》课程教学资源(书籍文献)A Tutorial on Principal Component Analysis(Jonathon Shlens).pdf
- 《模式识别》课程教学资源(书籍文献)A tutorial on Principal Components Analysis(Lindsay I Smith).pdf
- 《模式识别》课程教学资源(书籍文献)Data Clustering - A Review(A.K. JAIN、M.N. MURTY、P.J. FLYNN).pdf
- 《模式识别》课程教学资源(书籍文献)Data Clustering - 50 Years Beyond K-means.pdf
- 《模式识别》课程教学资源(书籍文献)Artificial neural networks - a tutorial(Anil K. Jain、Jianchang Mao).pdf
- 《模式识别》课程教学资源(书籍文献)Learning in Linear Neural Networks - A Survey.pdf
- 《模式识别》课程教学资源(书籍文献)Neural Networks for Classification - A Survey.pdf
- 电子科技大学:《随机过程及应用 Stochastic Processes and Applications》课程教学资源(课件讲稿)第0章 序言(覃思义).pdf
- 电子科技大学:《随机过程及应用 Stochastic Processes and Applications》课程教学资源(课件讲稿)第1章 预备知识 第1节 概率空间.pdf
- 电子科技大学:《随机过程及应用 Stochastic Processes and Applications》课程教学资源(课件讲稿)第1章 预备知识 第2节 随机变量及其分布.pdf
- 电子科技大学:《随机过程及应用 Stochastic Processes and Applications》课程教学资源(课件讲稿)第1章 预备知识 第3节 随机变量的函数.pdf