SVM原理与应用(PPT讲稿)

SⅥM原理与应用 HITSCIR-TM Group zkli-李泽魁
SVM原理与应用 HITSCIR-TM Group zkli-李泽魁

大纲 背景 线性分类 非线性分类 松弛变量 多元分类 应用 工具包
大纲 • 背景 • 线性分类 • 非线性分类 • 松弛变量 • 多元分类 • 应用 • 工具包 3

SⅦM背景 支持向量机 support vector machine SVM 5 6036978
SVM背景 • 支持向量机 – support vector machine – SVM 4

为什么要用SVM(个人观点) 分类效果好 @刘知远THUV JMLR201410月刊看到一篇神文: Do we Need Hundreds of Classifiers to solve Real Worid Classification Problems?测试了179种分类模型在UC有的121个数据上的性能,发现 Random Forests和swM(高斯核,用LbsM版本)性能最好,真是一个体力活,辛苦作者们 了.httplicn/r7nPBM 11月7日2104来自微博 weibo com 转发459评论2120 上手快 N种语言的N个 Toolkit ·理论基础完备 妇孺皆知的好模型 找工作需要它(利益相关: 应用与原理
为什么要用SVM(个人观点) • 分类效果好 • 上手快 – N种语言的N个Toolkit • 理论基础完备 – 妇孺皆知的好模型 • 找工作需要它(利益相关:面试狗一只) – 应用与原理 5

SVM发展历史 重要理论基础1 60年代, Vapnik和 Chervonenkis提出ⅤC维理论 重要理论基础2 1982年, Vapnik提出结构风险最小化理论 支持向量机( Support Vector Machine是 Cortes和 Vapnik于1995年首先提出的 它在解决小样本、韭线性及高维模式识别 中表现岀许多特有的优势,并能够推广应 用到函数拟合等其他机器学习问题中
SVM发展历史 • 重要理论基础1 – 60年代,Vapnik和Chervonenkis提出VC维理论 • 重要理论基础2 – 1982年,Vapnik提出结构风险最小化理论 • 支持向量机(Support Vector Machine)是 Cortes和Vapnik于1995年首先提出的 • 它在解决小样本、非线性及高维模式识别 中表现出许多特有的优势,并能够推广应 用到函数拟合等其他机器学习问题中 6

作者之一简介 Vapnik 《 Statistical Learning Theory》作者 书中详细的论证了统计机器学习之所以区别于 传统机器学习的本质,就在于统计机器学习能 够精确的给出学习效果,能够解答需要的样本 数等等一系列问题。 A》5 BELON
作者之一简介 • Vapnik – 《Statistical Learning Theory》作者 – 书中详细的论证了统计机器学习之所以区别于 传统机器学习的本质,就在于统计机器学习能 够精确的给出学习效果,能够解答需要的样本 数等等一系列问题。 7

SVM理论基础1(比较八股) 统计学习理论的VC维理论 ( Statistical| Learning theory或ST是研究有限样 本情况下机器学习规律的理论 ( Vapnik-Chervonenkis Dimension)反映了函数集 的学习能力,VC维越大则学习机器越复杂 瓦普尼克 统计学习理论 Statistical Learning Theory Statistical Learning Theory s points shattered 4 points impossible 是 ladimir N Vapnik着 一计建平张学 8
SVM理论基础1(比较八股) • 统计学习理论的VC维理论 – (Statistical Learning Theory或SLT)是研究有限样 本情况下机器学习规律的理论 – (Vapnik-Chervonenkis Dimension) 反映了函数集 的学习能力,VC维越大则学习机器越复杂 8

SVM理论基础2(比较八股) 结构风险最小化 机器学习本质上就是一种对问题真实模型的逼 近。这个与问题真实解之间的误差,就叫做风 险 结构化风险=经验风险+置信风险 经验风险=分类器在给定样木上的误差 置信风险=分类器在未知文本上分类的结果的 误差,代表了我们在多大程度上可以信任分类 器在未知文本上分类的结果。(无法准确估值 给出估计的区间)
SVM理论基础2(比较八股) • 结构风险最小化 – 机器学习本质上就是一种对问题真实模型的逼 近。这个与问题真实解之间的误差,就叫做风 险。 – 结构化风险 = 经验风险 + 置信风险 – 经验风险 = 分类器在给定样本上的误差 – 置信风险 = 分类器在未知文本上分类的结果的 误差,代表了我们在多大程度上可以信任分类 器在未知文本上分类的结果。(无法准确估值, 给出估计的区间) 9

SVM理论基础2(比较八股) 结构化风险=经验风险+置信风险 置信风险因素: 样本数量,给定的样本数量越大,学习结果越有可 能正确,此时置信风险越小; ·分类函数的vC维,显然VC维越大,推广能力越差, 置信风险会变大。 泛化误差界的公式* R(WsRemp(w)+op(n/h) 公式中Rw)就是真实风险,Remp(Ww)就是经验风险, φ(n/h就是置信风险。 ·统计学习的目标从经验风险最小化变为了寻求经验 风险与置信风险的和最小,即结构风险最小
SVM理论基础2(比较八股) • 结构化风险 = 经验风险 + 置信风险 – 置信风险因素: • 样本数量,给定的样本数量越大,学习结果越有可 能正确,此时置信风险越小; • 分类函数的VC维,显然VC维越大,推广能力越差, 置信风险会变大。 • 泛化误差界的公式* – R(w)≤Remp(w)+Ф(n/h) • 公式中R(w)就是真实风险,Remp(w)就是经验风险, Ф(n/h)就是置信风险。 • 统计学习的目标从经验风险最小化变为了寻求经验 风险与置信风险的和最小,即结构风险最小。 10

SVM理论基础(小结) 统计学习理论的VC维理论 SVM关注的是VC维 结构风险最小化 R(W)sRemp(w)+p(n/h)
SVM理论基础(小结) • 统计学习理论的VC维理论 – SVM关注的是VC维 • 结构风险最小化 – R(w)≤Remp(w)+Ф(n/h) 11
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- MSC Software Corporation:Dynamic System Modeling, Simulation, and Analysis Using MSC.EASY5(Advanced Class).ppt
- 《程序设计语言原理》课程教学资源(PPT课件讲稿)形式语义学 Formal Semantics.ppt
- 中国科学技术大学:《算法设计与分析》课程教学资源(PPT课件讲稿)第一部分 概率算法(黄刘生).ppt
- 《计算机组成原理》课程教学资源(PPT课件讲稿)第二章 电子计算机中信息的表示及其运算.ppt
- 虚拟存储(PPT课件讲稿)Virtual Memory.ppt
- Network Alignment(PPT讲稿)Treating Networks as Wireless Interference Channel.pptx
- 中国科学技术大学:《高级操作系统 Advanced Operating System》课程教学资源(PPT课件讲稿)第四章 分布式进程和处理机管理.ppt
- 东南大学:《操作系统概念 Operating System Concepts》课程教学资源(PPT课件讲稿)08 Main Memory(主讲:张柏礼).ppt
- 《高级语言程序设计》课程教学资源(试卷习题)试题三(无答案).doc
- 《数字图像处理》课程教学资源(PPT课件)第五章 代数运算.ppt
- 南京大学:《面向对象技术 OOT》课程教学资源(PPT课件讲稿)类和对象 Class and Object.ppt
- Detecting Evasion Attack at High Speed without Reassembly.ppt
- 《数字图像处理》课程教学资源(PPT课件)第七章 图像分割.ppt
- 中国科学技术大学:《信息论与编码技术》课程教学资源(PPT课件讲稿)第2章 离散信源及其信息测度.pptx
- 清华大学出版社:《计算机网络安全与应用技术》课程教学资源(PPT课件讲稿)第6章 黑客原理与防范措施.ppt
- 大连工业大学:《数据结构》课程教学资源(PPT课件讲稿,共十章,路莹).pps
- 哈尔滨工业大学:词义消歧(PPT讲稿)Word sense disambiguation.ppt
- 香港城市大学:Adaptive Random Test Case Prioritization(PPT讲稿).pptx
- 《单片机原理及接口技术》课程教学资源(PPT课件)第7章 AT89C51单片机系统扩展 7.4 数据存储器的扩展 7.5 I/O口的扩展.ppt
- 《计算机组装与维护》课程教学资源(PPT课件讲稿)第16章 常见计算机故障解决案例.ppt
- 安徽理工大学:《汇编语言》课程教学资源(PPT课件讲稿)第二章 80x86计算机组织.ppt
- 南京大学:《面向对象技术 OOT》课程教学资源(PPT课件讲稿)设计模式 Design Pattern(3).ppt
- 《C语言程序设计》课程教学资源(PPT课件讲稿)第2章 数据类型与常用库函数.ppt
- 山东大学:《数据结构》课程教学资源(PPT课件讲稿)第5章 堆栈(STACKS)Restricted version of a linear list.ppt
- 澳门大学:统计机器翻译领域适应性研究 Domain Adaptation for Statistical Machine Translation Master Defense.pptx
- 北京大学:《高级软件工程》课程教学资源(PPT课件讲稿)第九讲 静态代码的可信性分析概述.ppt
- 《C语言程序设计》课程教学资源(PPT课件讲稿)第10章 指针.ppt
- 南京大学:《面向对象技术 OOT》课程教学资源(PPT课件讲稿)分布对象 Distributed Objects(1).ppt
- 四川大学:《操作系统 Operating System》课程教学资源(PPT课件讲稿)Chapter 1 Computer System Overview.ppt
- 安徽理工大学:《算法设计与分析 Algorithm Design and Analysis》课程教学资源(PPT课件讲稿)第一章 导引与基本数据结构.ppt
- 《结构化程序设计》课程教学资源(PPT课件讲稿)第4章 VB控制结构.ppt
- 香港城市大学:PERFORMANCE ANALYSIS OF CIRCUIT SWITCHED NETWORKS(PPT讲稿).pptx
- 上海交通大学:《计算机组成原理 Computer Organization》课程教学资源(PPT课件讲稿)Chapter 4A The Processor, Part A.pptx
- 清华大学出版社:《计算机网络安全与应用技术》课程教学资源(PPT课件讲稿)第5章 Windows NT/2000的安全与保护措施.ppt
- 《人工智能》课程教学资源(PPT课件讲稿)第13章 智能优化计算简介.ppt
- 《计算机网络技术及应用》课程教学资源(PPT课件讲稿)第十一章 网络安全.ppt
- 《数字图像处理》课程教学资源(PPT课件讲稿)第八章 形态学处理.ppt
- 北京师范大学现代远程教育:《计算机应用基础》课程教学资源(PPT课件讲稿)第四篇 数据处理与数据分析.ppsx
- 《ARM Cortex-M3权威指南》课程教学资源(PPT课件讲稿)Cortex M3 存储系统访问.pptx
- 《人工智能》课程教学资源(PPT课件讲稿)Ch10 Auto-encoders(Auto and variational encoders v.9r6).pptx