中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第十二章 目标检测与识别 Object Detection and Recognition

第十二章目标检测与识别 Lecture 12 Object Detection and Recognition
第十二章 目标检测与识别 Lecture 12 Object Detection and Recognition

目标检测和识别 怎样检测和识别图像中物体,如汽车、牛等? 金0
目标检测和识别 怎样检测和识别图像中物体,如汽车、牛等?

目标识别的应用 地fa图 10.5214 FACESNAPO 视频监控 智能汽车 场景搜索 Google You Tube Videos Cetegortes mag0star间ne0eai Videos boing watched right now.. 0 基于内容的图像视频检索 医学图像分析
目标识别的应用

难点之一:如何鲁棒识别? 光照的影响 物体姿态的影响 背景混淆 遮挡 类内差异 视,点的影响
难点之一: 如何鲁棒识别?

类内差异(intra-class variability) Many face of Madonna
类内差异(intra-class variability)

类间相似性(inter-class similarity) www.marykateandashley.com news.bbc.co.uk/hi/english/in depth/americas/2000/us el ections 双胞胎 父子
类间相似性(inter-class similarity)

难点之二:计算量大 一幅图像中像素个数多,目前每秒约产生300G像素的 图像/视频数据。 -Google图片搜索中己有几百亿幅图像 -每天有3.5亿张以上的图片上传到Facebook(2015年) -全球销售约3.4亿部照相手机(2018年第一季度) 人的物体识别能力是强大的 ·灵长类动物约使用大脑皮层的一半来处理视觉信息、 [Felleman and van Essen 1991] -可以识别3,000-30,000种物体 ·物体姿态可允许30度以上的自由度
难点之二:计算量大 一幅图像中像素个数多,目前每秒约产生300G像素的 图像/视频数据。 - Google图片搜索中已有几百亿幅图像 - 每天有3.5亿张以上的图片上传到Facebook(2015年) - 全球销售约3.4亿部照相手机(2018年第一季度) 人的物体识别能力是强大的 - 灵长类动物约使用大脑皮层的一半来处理视觉信息 [Felleman and van Essen 1991] - 可以识别3,000-30,000种物体 - 物体姿态可允许30度以上的自由度

难点之三:如何在小样本条件下学习 低 (人为监督学习的复杂程度) 高 十 无标注,多物体 图像整体标注,有背 物体标注(分割到物 景混淆 体甚至部件)
难点之三:如何在小样本条件下学习

物体识别方法 》 检测(detection)vs.不检测 >表示(representation) 颜色、纹理、边缘、梯度、局部特征、深度、运 动等等。 y分类(classification or categorization) -K近邻(KNN) -神经网络(NN) 生成学习(Generative -支持向量机(SVM) learning.)vs.判别学习 Boosting(Adaboost) (discriminative -隐马尔科夫模型(HMM) learning) -其他
物体识别方法 检测(detection)vs. 不检测 表示(representation) - 颜色、纹理、边缘、梯度、局部特征、深度、运 动等等。 分类(classification or categorization) - K近邻(KNN) - 神经网络(NN) - 支持向量机(SVM) - Boosting(Adaboost等) - 隐马尔科夫模型(HMM) -其他 生成学习(Generative learning)vs. 判别学习 (discriminative learning)

生成学习Vs.判别学习 ,两种分类器学习模式 〉生成学习 目标是学习到待合训练数据的类别模型 -如EM算法(Maximum Likelihood) 判别学习 口在训练阶段即考虑类别之问的判别信息、 ☐包括Support Vector Machines(SVMs),Boosting,Minimum Classification Error (MCE),Maximum Mutual Information (MMI),Lager Margin (LM),and etc. ,判别学习算法比生成学习算法表现出更好的分类性能
生成学习 vs. 判别学习 两种分类器学习模式 生成学习 ---目标是学习到符合训练数据的类别模型 --- 如EM算法(Maximum Likelihood) 判别学习 在训练阶段即考虑类别之间的判别信息 包括Support Vector Machines (SVMs), Boosting, Minimum Classification Error (MCE), Maximum Mutual Information (MMI), Lager Margin (LM), and etc. 判别学习算法比生成学习算法表现出更好的分类性能
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第十一章 三维重建 3D Reconstruction.ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第十章 基于立体视觉的深度估计(立体视觉深度获取).ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第九章 单幅图像深度重建 Depthmap Reconstruction Based on Monocular cues(1/2)Shape From Shading.ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第七章 基于运动视觉的场景复原 Shape(Structure)From Motion.ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第六章 基于特征的图像对准.ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)Mean Shift Segmentation Algorithm & Ncuts.ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第五章 图像分割(主动轮廓线模型——Snake模型).ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第四章 特征的提取与匹配(2/2)边缘以及边特征提取.ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第四章 特征的提取与匹配(1/2)特征的提取.ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第三章 图像处理基础(2/2).ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第三章 图像处理基础(1/2).ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第二章 视觉的基本知识 第三节 视觉系统的几何特性.ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第二章 视觉的基本知识 第二节 视觉物理学特性.pptx
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第二章 视觉的基本知识 第一节 人类生理视觉系统.ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第一章 绪论 Computer Vison(主讲:曹洋).ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(参考论文)3D photography on your desk.pdf
- 中国科学技术大学:《计算机视觉》课程教学资源(参考论文)Tour Into the Picture_Using a Spidery Mesh Interface to Make Animation from a Single Image.pdf
- 中国科学技术大学:《信号与图像处理基础 Signal and Image Processing》课程教学资源(PPT课件讲稿)09 图像压缩 Image Compression.pptx
- 中国科学技术大学:《信号与图像处理基础 Signal and Image Processing》课程教学资源(PPT课件讲稿)要点复习 Review(主讲:曹洋).pptx
- 中国科学技术大学:《信号与图像处理基础 Signal and Image Processing》课程教学资源(PPT课件讲稿)08 自适应滤波 Adaptive Filter.pptx
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第九章 单幅图像深度重建 Depthmap Reconstruction Based on Monocular cues(2/2)基于灭点几何的深度图重建.ppt
- 北京邮电大学:《软件工程》课程教学资源(PPT课件讲稿)软件设计——人机交互界面设计.pdf
- Oracle数据库中的海量数据处理.pdf
- JVM 详解(Java Virtual Machine).pdf
- Python 基础教程(version 0.5).pdf
- GCC 中文手册(GNU Tools,2003).pdf
- 数据库设计规范指南(Database Design).pdf
- 《高质量C++编程指南》PDF电子资料(2001,v1.0,共十一章,林锐).pdf
- Linux嵌入式实时操作系统开发与应用.pdf
- 《UML经典教程》参考资料:UML期末考试参考资料.pdf
- 《UML经典教程》参考资料:统一建模语言UML.pdf
- 《UML经典教程》参考资料:UML系统分析与架构设计实战.pdf
- java:23种设计模式.pdf
- IT运维管理培训.pdf
- 《UML经典教程》参考资料:UML建模基础——UML建模相关.pdf
- 重构——改善既有代码的设计.pdf
- 《UML经典教程》参考资料:UML软件建模技术(中文全版,共十四章).pdf
- 《UML经典教程》参考资料:UML Modeling.pdf
- 《UML经典教程》参考资料:UML与Rational Rose讲义.pdf
- 大道至简——软件工程实践者的思想(周爱民).pdf