哈尔滨工业大学:逻辑斯蒂回归与最大熵(PPT课件讲稿)

HIT-SCIR 逻辑斯蒂回归与最大熵 HIT-SCIR 李泽魁 2013-11-22 哈工大社会计算与信息检索研究中心
哈工大社会计算与信息检索研究中心 逻辑斯蒂回归与最大熵 HIT-SCIR 李泽魁 2013-11-22

HIT-SCIR 目录 线性回归 逻辑斯蒂回归 最大熵模型 极大似然估计 模型学习浅谈 最大熵总结 最大熵应用举例(略) 最大熵源码分析(略) 最大熵包使用(略) 哈工大社会计算与信息检索研究中心
哈工大社会计算与信息检索研究中心 目录 • 线性回归 • 逻辑斯蒂回归 • 最大熵模型 • 极大似然估计 • 模型学习浅谈 • 最大熵总结 • 最大熵应用举例(略) • 最大熵源码分析(略) • 最大熵包使用(略) 2/79

(R HIT-SCIR 60线性回归 Linear regression) 15 -20-10 1020 50 单参数线性回归 Linear Regression with one variable 哈工大社会计算与信息检索研究中心
哈工大社会计算与信息检索研究中心 6.0 线性回归(Linear regression) 单参数线性回归 Linear Regression with one variable 3/79

(R HIT-SCIR 线性回归 Linear regression) 通俗解释 其想要做的就是发现自变量和因变量之间的某 种关联,即给定了自变量我们可以得到因变量 的值。 哈工大社会计算与信息检索研究中心 479
哈工大社会计算与信息检索研究中心 线性回归(Linear regression) • 通俗解释: – 其想要做的就是发现自变量和因变量之间的某 种关联,即给定了自变量我们可以得到因变量 的值。 4/79

(R HIT-SCIR 线性回归 Linear regression) 专业解释 线性回归模型是,种研究一个因变量( bepedent Variable)同 个或者多个自变量( Independent variable)之间关系的分析 方法 Yi=Bo+B1Xi1 +B2 Xi2+.+B Xip+ei y为因变量 beta为回归模型的常数项 K为自变量的个数 X1,x2,…,xK为自变量 beta1,beta2,,beta为自变量的系数 epsilon为随机扰动:表示那些不包含在自变量中但是仍然可 能对因变量产生影响的因素 哈工大社会计算与信息检索研究中心 579
哈工大社会计算与信息检索研究中心 线性回归(Linear regression) • 专业解释: – 线性回归模型是一种研究一个因变量(Depedent Variable)同 一个或者多个自变量(Independent Variable)之间关系的分析 方法. – y为因变量 – beta0为回归模型的常数项 – K为自变量的个数 – x1, x2, …, xK为自变量 – beta1, beta2, …, betaK为自变量的系数 – epsilon 为随机扰动: 表示那些不包含在自变量中但是仍然可 能对因变量产生影响的因素. 5/79

(R HIT-SCIR 线性回归 Linear regression) 式(1)F=B0+Bxx 式(2) Y=B+BX+BXX 式(3) 参数为F=e 那么 B=(0,B1 (1)ye es (2)yes,关于参数线性,通过基变换 basis expansions转化将非线性的自变量特征映射到新 的自变量特征。 3)no 哈工大社会计算与信息检索研究中心 679
哈工大社会计算与信息检索研究中心 线性回归(Linear regression) 式(1) 式(2) 式(3) 参数为 那么 (1)yes (2)yes,关于参数线性,通过基变换basis expansions转化将非线性的自变量特征映射到新 的自变量特征。 (3)no 6/79

HIT-SCIR 目录 线性回归 逻辑斯蒂回归 °最大熵模型 极大似然估计 模型学习浅谈 最大熵总结 最大熵应用举例(略) 最大熵源码分析(略) 最大熵包使用(略 哈工大社会计算与信息检索研究中心
哈工大社会计算与信息检索研究中心 目录 • 线性回归 • 逻辑斯蒂回归 • 最大熵模型 • 极大似然估计 • 模型学习浅谈 • 最大熵总结 • 最大熵应用举例(略) • 最大熵源码分析(略) • 最大熵包使用(略) 7/79

HIT-SCIR 对数线性模型 对数线性模型( og-linear model)是线性回归 模型的一个变形,因为使用原始数据的对数 建模而得名 对数线性模型的求解和线性回归模型没有 什么区别,不同是的对模型参数的解释:在对 数线性模型,模型参数代表的是因变量对自 变量的弹性(E=(△Y)/(△ⅩX 逻辑斯蒂回归和最大熵模型都属于对数线 性模型 哈工大社会计算与信息检索研究中心 8/79
哈工大社会计算与信息检索研究中心 对数线性模型 • 对数线性模型(log-linear model)是线性回归 模型的一个变形, 因为使用原始数据的对数 建模而得名. • 对数线性模型的求解和线性回归模型没有 什么区别, 不同是的对模型参数的解释: 在对 数线性模型, 模型参数代表的是因变量对自 变量的弹性(E=(△Y/Y) / (△X/X)). • 逻辑斯蒂回归和最大熵模型都属于对数线 性模型 8/79

HIT-SCIR 逻辑斯蒂回归 Logistic regression模型( Logit model)是离散 选择法模型之一,属于多重变量分析范畴, 是社会学、生物统计学、临床、数量心理 学、计量经济学、市场营销等统计实证分 析的常用方法。 (例子略) 哈工大社会计算与信息检索研究中心 979
哈工大社会计算与信息检索研究中心 逻辑斯蒂回归 • Logistic regression模型(Logit model)是离散 选择法模型之一,属于多重变量分析范畴, 是社会学、生物统计学、临床、数量心理 学、计量经济学、市场营销等统计实证分 析的常用方法。 • (例子略) 9/79

(R HIT-SCIR 61.1逻辑斯蒂回归分布 分布函数两种写法 0+1x 丌(x e/0+1x+11+e-(50+B1z) F(x)=P(X≤x)= 1+e-(x-a)/r 图像 0 # 6 哈工大社会计算与信息检索研究中心
哈工大社会计算与信息检索研究中心 6.1.1 逻辑斯蒂回归分布 • 分布函数 两种写法 • 图像 # 10/79
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 软件开发环境与工具(PPT讲稿)Software development environment and tool.ppt
- 语义网与本体(PPT讲稿)Semantic Web & Ontology(元数据 Metadata).ppt
- 《数据结构》课程教学资源(PPT课件讲稿)第五章 数组.ppt
- 香港科技大学:片上网络(PPT讲稿)network-on-chip(NoC)NoC Building Blocks.pptx
- 南京大学:《自然语言处理 Natural Language Processing(NLP)》课程教学资源(PPT课件讲稿)自然语言处理概述、基于规则(知识工程)的传统自然语言处理方法(理性方法).ppt
- 西安电子科技大学:《操作系统 Operating Systems》课程教学资源(PPT课件讲稿)Chapter 06 文件系统 File Systems(主讲:高海昌).ppt
- 香港大学:Data Analysis - Factors Potentially Affecting Development.pptx
- 北京大学:《高级编译技术 Advanced Compiler Techniques》课程教学资源(PPT课件讲稿)Introduction to Optimizations.ppt
- 南京大学:《编译原理》课程教学资源(PPT课件讲稿)第四章 语法分析(戴新宇).pptx
- 《计算机组装与维修》课程教学资源(PPT课件讲稿)第十三章 局域网维护及常见故障处理.ppt
- 北京大学:《软件需求工程》课程教学资源(PPT课件讲稿)第十章 软件需求开发与管理工具.ppt
- 中国科学技术大学:《网络信息安全 NETWORK SECURITY》课程教学资源(PPT课件讲稿)第二章 数据加密技术基础.ppt
- 《汇编语言》课程教学资源(PPT课件讲稿)第6章 子程序.ppt
- 中国科学技术大学:《计算机体系结构》课程教学资源(PPT课件讲稿)MSI、MESI、分布式共享存储器体系结构、Models of Memory Consistency.pptx
- 《数据库系统概论》课程教学资源(PPT课件讲稿)第六章 数据库设计.ppt
- 电子科技大学:《汇编语言程序设计》课程教学资源(PPT课件)第一章 基础知识(主讲:詹瑾瑜).ppt
- 进程(PPT课件讲稿)Processes.pptx
- 《大学计算机基础》课程教学资源(PPT课件讲稿)第四章 Excel 2007电子表格.ppt
- 东南大学:《C++语言程序设计》课程教学资源(PPT课件讲稿)Chapter 11 Operator Overloading; String and Array Objects(主讲:东方).ppt
- 《计算机网络》课程实验教学大纲.pdf
- 《机器学习》教学资源(PPT讲稿)支持向量机 support vector machines.ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第二章 视觉的基本知识.ppt
- 《编译原理》课程教学资源(PPT课件讲稿)第二章 词法分析.ppt
- 《计算机网络》课程教学资源(PPT课件)第4讲 以太网组网及故障排除.ppt
- VB.Net程序设计基础(PPT课件讲稿).ppt
- 《计算机导论》课程教学资源(PPT课件讲稿)第9章 计算机学科方法论.ppt
- 厦门大学:《大数据技术原理与应用》课程教学资源(PPT课件讲稿,2017)第11章 图计算.ppt
- 《Visual Basic 6.0程序设计》课程教学资源(PPT课件)第四章 常用控件与窗体.ppt
- 大连工业大学:《计算机程序设计(C语言版)》课程教学资源(PPT课件讲稿,共十三章).pps
- 《高级语言程序设计》课程教学资源(试卷习题)试题五(无答案).doc
- 《计算机文化基础》课程教学大纲 Computer Culture Foundation.pdf
- 《图像处理与计算机视觉 Image Processing and Computer Vision》课程教学资源(PPT课件讲稿)Chapter 08 Stereo vision.pptx
- 《计算机网络 Computer Networking》课程教学资源(PPT课件讲稿,英文版)Chapter 6 Wireless and Mobile Networks.ppt
- Gas Systems Modeling andSimulation with MSC.EASY5:GD Advanced Class Notes(EAS105 Course Notes).ppt
- 哈尔滨工业大学:《语言信息处理》课程教学资源(PPT课件讲稿)机器翻译 II Machine Translation II.ppt
- 四川大学:《操作系统 Operating System》课程教学资源(PPT课件讲稿)Chapter 3 Process Description and Control 3.1 What is a Process 3.2 Process States 3.3 Process Description.ppt
- 《计算机应用基础》课程教学资源(PPT课件讲稿)第四章 电子表格软件(Excel 2003).ppt
- 《计算机文化基础》课程教学资源(PPT课件讲稿)第七章 计算机网络基础.ppt
- 大数据集成(PPT讲稿)Big Data Integration.pptx
- 中国科学技术大学:《嵌入式操作系统 Embedded Operating Systems》课程教学资源(PPT课件讲稿)第四讲 CPU调度(part II).ppt