中国科学技术大学:《机器学习》课程PPT教学课件(讲稿)第二章 模型评估与选择

第二章:模型评估 与选择
第二章:模型评估 与选择

大纲 口经验误差与过拟合 口评估方法 口性能度量 口比较检验 口偏差与方 口阅读材料
大纲 经验误差与过拟合 评估方法 性能度量 比较检验 偏差与方差 阅读材料

经验误差与过拟合 口错误率&误差 ●错误率:错分样本的占比:E=a/m ●误差:样本真实输出与预测输出之间的差异 训练(经验)误差:训练集上 测试误差:测试集 泛化误差:除训练集外所有样本 由于事先并不知道新样本的特征,我们只能努力使经验 误差最小化; 很多时候虽然能在训练集上做到分类错误率为零,但多 数情况下这样的学习器并不好
经验误差与过拟合 错误率&误差: ⚫ 错误率: 错分样本的占比: ⚫ 误差:样本真实输出与预测输出之间的差异 ⚫ 训练(经验)误差:训练集上 ⚫ 测试误差:测试集 ⚫ 泛化误差:除训练集外所有样本 由于事先并不知道新样本的特征,我们只能努力使经验 误差最小化; 很多时候虽然能在训练集上做到分类错误率为零,但多 数情况下这样的学习器并不好

经验误差与过拟合 口过拟合: 学习器把训练样本学习的“太好”,将训练样本本身的特点 当做所有样本的一般性质,导致泛化性能下降 优化目标加正则项 early stop 口欠拟合 对训练样本的一般性质尚未学好 ●决策树:拓展分支 ●神经网络:增加训练轮数
经验误差与过拟合 过拟合: 学习器把训练样本学习的“太好”,将训练样本本身的特点 当做所有样本的一般性质,导致泛化性能下降 ⚫ 优化目标加正则项 ⚫ early stop 欠拟合: 对训练样本的一般性质尚未学好 ⚫ 决策树:拓展分支 ⚫ 神经网络:增加训练轮数

经验误差与过拟合 过拟合模型分类结果: →不是树叶 树叶训练样本 (误以为树叶必须有锯齿) 新样本 欠拟合模型分类结果: →是树叶 (误以为绿色的都是树叶) 过拟合、欠拟合的直观类比 苯都紧自堂习器把训练样本本身特点当做所有潜在样 具有的一般性质 欠拟合:训练样本的一般性质尚未被学习器学好
经验误差与过拟合 过拟合:学习器把训练样本本身特点当做所有潜在样 本都会具有的一般性质. 欠拟合:训练样本的一般性质尚未被学习器学好

大纲 口经验误差与过拟合 口评估方法 口性能度量 口比较检验 口偏差与方 口阅读材料
大纲 经验误差与过拟合 评估方法 性能度量 比较检验 偏差与方差 阅读材料

评估方法 现实任务中往往会对学习器的泛化性能、时间开销、存 储开销、可解释性等方面的因素进行评估并做出选择 我们假设测试集是从样本真实分布中独立采样获得, 将测试集上的“测试误差”作为泛化误差的近似,所 以测试集要和训练集中的样本尽量互斥
评估方法 现实任务中往往会对学习器的泛化性能、时间开销、存 储开销、可解释性等方面的因素进行评估并做出选择 我们假设测试集是从样本真实分布中独立采样获得, 将测试集上的“测试误差”作为泛化误差的近似,所 以测试集要和训练集中的样本尽量互斥

评估方法 通常将包含个m样本的数据集D={(x1,y),(x2,v),…,(xm,m)} 拆分成训练集S和测试集T: 口留出法: ●直接将数据集划分为两个互斥集合 ●训练/测试集划分要尽可能保持数据分布的一致性 ●一般若干次随机划分、重复实验取平均值 ●训练/测试样本比例通常为2:1~4:1
评估方法 留出法: ⚫ 直接将数据集划分为两个互斥集合 ⚫ 训练/测试集划分要尽可能保持数据分布的一致性 ⚫ 一般若干次随机划分、重复实验取平均值 ⚫ 训练/测试样本比例通常为2:1~4:1 通常将包含个 样本的数据集 拆分成训练集 和测试集 :

评估方法 口交叉验证法: 将数据集分层采样划分为k个大小相似的互斥子集,每次用k-1个子 集的并集作为训练集,余下的子集作为测试集,最终返回k个测试 结果的均值,k最常用的取值是10 L DiDaDa. D D- Ds DoDid 训练集 测试集 D1D2D3DDDD-DD][Da→测试结果1 D,D,D, DA DS Do D,DD[D]一测试结果2平均返回 结果 DaD, D: Ds Da Ds D Did[一测试结果10 10折交叉验证示意图
评估方法 交叉验证法: 将数据集分层采样划分为k个大小相似的互斥子集,每次用k-1个子 集的并集作为训练集,余下的子集作为测试集,最终返回k个测试 结果的均值,k最常用的取值是10

评估方法 与留出法类似,将数据集D划分为k个子集同样存在多种划分方式, 为了減小因样本划分不同而引入的差别,k折交叉验证通常随机使用 值,例如常宽的“10次10折交叉验证”次k折交叉验证结果的均 不同的划分重复p次,最终的评估结果是 假设数据集D包含m个样本,若k=m,则得到留一法: ●不受随机样本划分方式的影响 ●结果往往比较准确 ●当数据集比较大时,计算开销难以忍受
评估方法 与留出法类似,将数据集D划分为k个子集同样存在多种划分方式, 为了减小因样本划分不同而引入的差别,k折交叉验证通常随机使用 不同的划分重复p次,最终的评估结果是这p次k折交叉验证结果的均 值,例如常见的“10次10折交叉验证” 假设数据集D包含m个样本,若令 ,则得到留一法: ⚫ 不受随机样本划分方式的影响 ⚫ 结果往往比较准确 ⚫ 当数据集比较大时,计算开销难以忍受
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 山东大学:《面向对象程序设计》课程教学资源(PPT课件讲稿)第四章 编写对象接口.ppt
- 《网站设计与建设 Website design and developments》课程教学资源(PPT课件讲稿)第三部分 网站设计技术 第10章 HTML基础.ppt
- 清华大学:《计算机导论》课程电子教案(PPT教学课件)第8章 计算机领域的典型问题.ppt
- 《单片机应用技术》课程PPT教学课件(C语言版)第7章 定时器/计数器.ppt
- 面向对象编程 Object-Oriented Programming(PPT课件讲稿)继承 Inheritance.ppt
- 《C语言程序设计》课程教学资源(PPT课件)第6章数据类型和表达式.ppt
- Scanning Electron Microscopy(SEM).ppt
- 《The C++ Programming Language》课程教学资源(PPT课件讲稿)Lecture 03 Standard Template Library & Generic Programming.ppt
- 计算机问题求解(PPT讲稿)图的计算机表示以及遍历.pptx
- 系统软件与软件安全(PPT讲稿)构造安全、高效的系统软件.pptx
- 中国科学技术大学:《计算机体系结构》课程教学资源(PPT课件讲稿)第3章 流水线技术.ppt
- 合肥学院:《数据库原理与应用》课程教学资源(PPT课件)第4章 数据库的创建与管理.ppt
- 四川大学:《数据库技术》课程教学资源(PPT课件讲稿)第9章 数据库系统开发工具VB.ppt
- 上海交通大学:IT项目管理(PPT讲稿)讲座6 软件项目工作量估算.ppt
- 《操作系统》课程PPT教学课件(英文)内存管理 Memory Management.ppt
- 湖南生物机电职业技术学院:《电子商务概论》课程教学资源(PPT课件)第八章 电子商务安全.ppt
- 电子科技大学:《计算机操作系统》课程教学资源(PPT课件讲稿)第四章 设备管理 Device Management and Disk Scheduling.ppt
- 南京大学:模型检测(PPT课件讲稿)Model Checking.pptx
- 《计算机网络》课程教学大纲 Computer Networks.pdf
- 中国科学技术大学:《Linux操作系统分析》课程教学资源(PPT课件讲稿)Linux的进程(1/3).ppt
- 《C语言程序设计》课程电子教案(PPT课件)第三章 控制语句.ppt
- 安徽理工大学:《计算机网络》课程PPT教学课件(第4版)第1章 概述(编著:谢希仁).ppt
- 中国人民大学:《数据库系统概论 An Introduction to Database System》课程教学资源(PPT课件讲稿)第九章 关系查询处理和查询优化.ppt
- 《人工智能技术导论》课程教学资源(PPT课件讲稿)第8章 不确定性知识的表示与推理.ppt
- 福建工程学院:《C#程序设计》课程教学资源(实验指导书).doc
- 《计算机网络技术》课程教学资源(PPT课件讲稿)Chapter 03 物理层.ppt
- 沈阳理工大学:《网站建设与维护》课程教学资源(PPT课件讲稿)第四章 动态网页基础.ppt
- 东南大学:《操作系统概念 Operating System Concepts》课程教学资源(PPT课件讲稿)13 文件系统 I/O Systems.ppt
- 《C语言程序设计》课程教学资源(PPT课件讲稿)第6章 函数.ppt
- 《高级语言程序设计》课程教学资源(试卷习题)试题一(无答案).doc
- 中国科学技术大学:《密码学导论》课程教学资源(PPT课件讲稿)第4章 数论基础(主讲:李卫海).pptx
- 香港科技大学:Cross-Selling with Collaborative Filtering(PPT讲稿).ppt
- 西安电子科技大学:《微机原理与接口技术》课程教学资源(PPT课件讲稿)第七章 常用接口芯片技术.pptx
- 西安交通大学:《程序设计语言》课程电子教案(PPT教学课件)第二章 Fortran程序设计基础.ppt
- 河南中医药大学(河南中医学院):《计算机网络》课程教学资源(PPT课件讲稿)第一章 计算机网络概述(2015版).ppt
- 软件测试(PPT课件讲稿)黑盒测试.pptx
- 《PHP程序设计》课程教学资源(教学大纲).doc
- 中国人民大学:《数据库系统概论 An Introduction to Database System》课程教学资源(PPT课件讲稿)第一章 绪论.ppt
- 《计算机网络》课程教学资源(PPT课件讲稿)第三章 数据链路层.ppt
- 山东大学:《微机原理及单片机接口技术》课程教学资源(PPT课件讲稿)第七章 定时计数器与可编程计数器阵列.ppt