《机器学习》课程教学资源(PPT课件讲稿)第10讲 决策树

ch10决策树
Ch 10. 决策树

特征类型 数值数据( numerical data) 例:{1.2,4.5,33} ·模式间可以计算距离度量 ·基于度量的模式分类方法 标称数据( nominal data) 例:{红色,有光泽,甜,小} ·模式间没有距离的概念 ·非度量方法
特征类型 • 数值数据(numerical data) • 例:{1.2, 4.5, 3.3} • 模式间可以计算距离度量 • 基于度量的模式分类方法 • 标称数据 (nominal data) • 例:{红色,有光泽,甜,小} • 模式间没有距离的概念 • 非度量方法

决策树 ·什么是决策树? 决策树是一种类似流程图的树形结构,每个内部节点表 示一个测试(查询),该节点的每个分支表示该测试的 个结果,每个叶节点表示一个类别 决策树的构成 根节点(root) 分支( branch) 叶节点(leaf)
决策树 • 什么是决策树? • 决策树是一种类似流程图的树形结构,每个内部节点表 示一个测试(查询),该节点的每个分支表示该测试的 一个结果,每个叶节点表示一个类别 • 决策树的构成 • 根节点(root) • 分支(branch) • 叶节点(leaf)

决策树 root Color? level o green red vellow Size? Shape? Size? level bis round thin medium Watermelon Apple grape Size?) Banana( Apple (taste? level 2 g sweet soul Grapefruit Lemon Cherry Grape level 3
决策树

决策树 ·决策树分类过程 ·从根节点开始,首先对某一属性的取值提问 Color? ·与根节点相连的不同分支,对应这个属性的不同取值 ° green;yeow;red; ·根据不同的回答,转向相应的分支 green ·在新到达的节点处做同样的分支判断 Size?-big ·这一过程持续,直到到达某个叶节点,输出该叶节点的 类别标记 Watermelon
决策树 • 决策树分类过程 • 从根节点开始,首先对某一属性的取值提问 • Color? • 与根节点相连的不同分支,对应这个属性的不同取值 • green; yellow;red; • 根据不同的回答,转向相应的分支 • green • 在新到达的节点处做同样的分支判断 • Size? – big. • 这一过程持续,直到到达某个叶节点,输出该叶节点的 类别标记 • Watermelon

决策树 ·决策树的判决面 x2 R 尺1 R
决策树 • 决策树的判决面

决策树 ·决策树的优势 ·语义可表示性 ·从根节点到叶节点表示为合取式 (颜色=黄)AND(形状=细长)□香蕉 ·利用合取式和析取式获得某个类别的明确描述 ·苹果=(绿色AND中等大小)OR(红色AND中等大小) 分类速度快 ·只需一系列简单查询即可对模式的类别做出判断 可以很自然地嵌入专家的先验知识
决策树 • 决策树的优势 • 语义可表示性 • 从根节点到叶节点表示为合取式 • (颜色=黄)AND(形状=细长) 香蕉 • 利用合取式和析取式获得某个类别的明确描述 • 苹果=(绿色 AND 中等大小)OR(红色 AND 中等大小) • 分类速度快 • 只需一系列简单查询即可对模式的类别做出判断 • 可以很自然地嵌入专家的先验知识

决策树学习算法 ·决策树研究历史 第一个决策树算法称为cLs( Concept Learning System [E B Hunt, J. Marin, and P. T. Stone's book"Experiments in Induction"published by Academic Press in 19667 真正引发决策树研究热潮的算法是ID3 [J.R. Quinlan's paper in a book "Expert Systems in the Micro Electronic Age"edited by D. Michie, published by Edinburgh University Press in 1979 最流行的决策树算法c45 J.R. Quinlan's book"C4. 5: Programs for Machine Learning"published by Morgan Kaufmann in 19931
决策树学习算法 • 决策树研究历史 • 第一个决策树算法称为CLS (Concept Learning System) [E. B. Hunt, J. Marin, and P. T. Stone’s book “Experiments in Induction”published by Academic Press in 1966] • 真正引发决策树研究热潮的算法是ID3 [J. R. Quinlan’s paper in a book “Expert Systems in the Micro Electronic Age” edited by D. Michie, published by Edinburgh University Press in 1979] • 最流行的决策树算法C4.5 [J. R. Quinlan’s book “C4.5: Programs for Machine Learning” published by Morgan Kaufmann in 1993]

决策树学习算法 ·决策树研究历史 通用的决策树算法 CART (Classification and Regression Tree) [L. Breiman, J H. Friedman, R A. Olshen, and C J. Stone's book"Classification and Regression Trees"published by Wadsworth in 1984] ·基于决策树的集成学习算法:随机森林( Random Forests [L. Breiman's MLJ01 paper"Random Forests"'I
决策树学习算法 • 决策树研究历史 • 通用的决策树算法CART (Classification and Regression Tree) [L. Breiman, J. H. Friedman, R. A. Olshen, and C. J. Stone’s book “Classification and Regression Trees” published by Wadsworth in 1984] • 基于决策树的集成学习算法:随机森林 (Random Forests) [L. Breiman’s MLJ’01 paper “Random Forests”]

构造决策树 基本过程 从上到下,分而治之(dide-and- conquer),递归生 长 ·最初,所有的样本都在根节点 ·所有属性都是标称型的(如果是连续数值型的,则需要 预先离散化) ·所有样本根据每次选择出的属性递归的逐渐划分开来 选择出来的属性称为一个划分(sp|t)或测试(test)或查询 (query) 査询的选择基于启发式或者统计特征
构造决策树 • 基本过程 • 从上到下,分而治之(divide-and-conquer),递归生 长 • 最初,所有的样本都在根节点 • 所有属性都是标称型的(如果是连续数值型的,则需要 预先离散化) • 所有样本根据每次选择出的属性递归的逐渐划分开来 选择出来的属性称为一个划分(split)或测试(test)或查询 (query) • 查询的选择基于启发式或者统计特征
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- Flexible Online Task Assignment in Real-Time Spatial Data.pptx
- 北京大学:《项目成本管理》课程教学资源(PPT课件讲稿)质量管理计划(主讲:周立新).ppt
- Efficient Algorithms for Optimal Location Queries in Road Networks.ppt
- 《计算机网络》课程教学资源(PPT课件讲稿,第三版)Chapter 04 网络层 Network Layer.ppt
- 《电子商务概论》课程教学资源(PPT课件讲稿)第7章 电子商务与物流.ppt
- 《网络算法学》课程教学资源(PPT课件讲稿)第四章 原则的运用.ppt
- 清华大学:计算机科学与技术(PPT讲稿)组播 Multicast.pptx
- 《机器学习》课程教学资源(PPT课件讲稿)第七章 贝叶斯分类器 MACHINE LEARNING.pptx
- 西安电子科技大学:《计算机网络 Computer Networks》课程教学资源(PPT课件讲稿)第五章 传输层.pptx
- 清华大学:不确定型决策(PPT讲稿)Decision Making under Uncertainty.pptx
- 《Computer Networking:A Top Down Approach》英文教材教学资源(PPT课件讲稿,4th edition)Chapter 1 Introduction.ppt
- 《神经网络和模糊系统》课程教学资源(PPT讲稿)第四章 突触动力学、非监督学习.ppt
- 南京航空航天大学:《C++》课程电子教案(PPT课件讲稿)第4章 类的高级部分.ppt
- 西安电子科技大学:《计算机网络 Computer Networks》课程教学资源(PPT课件讲稿)概述(主讲:岳鹏).ppt
- 计算机语言的学科形态与发展历程(PPT课件讲稿).ppt
- 西安电子科技大学:《计算机网络 Computer Networks》课程教学资源(PPT课件讲稿)第一章 概述(主讲:马涛).pptx
- 北京航空航天大学:动态拼车服务中的高效插入操作(PPT讲稿)An Efficient Insertion Operator in Dynamic Ridesharing Services.pptx
- 中国科学技术大学:《计算机体系结构》课程教学资源(PPT课件讲稿)第三章 流水线技术.pptx
- 《网络算法学》课程教学资源(PPT课件讲稿)第二部分 端节点算法学 第五章 拷贝数据.ppt
- 中国科学技术大学:《数值分析》课程教学资源(PPT课件讲稿)第1章 插值.ppt
- 《物联网技术导论》课程教学资源(PPT讲稿)Continuous Scanning with Mobile Reader in RFID Systems - an Experimental Study.pptx
- 西安电子科技大学:《计算机网络 Computer Networks》课程教学资源(PPT课件讲稿)第六章 应用层.pptx
- 沈阳理工大学:《计算机网络技术及应用》课程教学资源(PPT课件讲稿)第一章 互联网与网站 Interent & Website(主讲:廉哲).ppt
- 香港科技大学:Transaction Management、Serializability Theory and Concurrency Control、Lock-Based Protocols、Deadlock Problems、Recovery.ppt
- 《大学计算机基础》课程电子教案(PPT教学课件)第5章 多媒体技术基础.ppt
- 中国科学院:超级计算平台Linux初级培训(PPT讲稿,2009.11).ppt
- Routing in Vehicular Ad Hoc Network(PPT课件讲稿).ppt
- Linux操作系统初级培训(PPT讲稿)DSC认证培训体系.ppt
- Linux操作系统使用(PPT讲稿,简明基础教程,共七章).ppt
- 香港科技大学:Overviewof the Internet of Things(IoTs,PPT课件讲稿).ppsx
- 《C语言程序设计》课程教学资源(PPT课件讲稿)第3章 最简单的C程序设计.ppt
- 清华大学出版社:《C程序设计》课程PPT教学课件(第三版)第二章 程序的灵魂——算法.ppt
- 《数据库原理》课程教学资源(PPT课件讲稿)第五章 数据库的存储结构.ppt
- 《编译原理》课程教学资源(PPT课件讲稿)第六章 句法结构模式识别.ppt
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(PPT课件讲稿)图论补充内容.pptx
- 中央电大:《计算机组成原理》课程教学资源(PPT课件讲稿)教学辅导.ppt
- 《网站建设》课程教学资源(PPT课件讲稿)第五章 Javascript脚本语言.ppt
- 安徽工贸职业技术学院:《计算机组装与维护》课程教学资源(PPT课件讲稿)项目四 搭建微型计算机软件系统.ppt
- 《图像处理与计算机视觉 Image Processing and Computer Vision》课程教学资源(PPT课件讲稿)Chapter 07 Mean-shift and Cam-shift.pptx
- 华中科技大学:《操作系统原理》课程电子教案(PPT教学课件)第一章 绪论Principles of Operating System(主讲:郑然).ppt