西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第七讲 动态博弈分析(下)

历些毛子代枝大学 逆向归纳法 XIDIAN UNIVERSITY 一个例子 D 策略式(收益矩阵)表述 见右下图。 B (2,2) A2 *可见,它有两个纳什均衡: R (3,1)和(2,2)。 (3.1) (0,0) 如果A选择U,B的信息集 B 就不可达,即B的信息集 L R 不在均衡路径上。 U 2,2 2,2 D 3,1 0,0
逆向归纳法 一个例子 策略式(收益矩阵)表述 见右下图。 可见,它有两个纳什均衡: (3, 1) 和 (2, 2)。 如果A选择U, B的信息集 就不可达, 即B的信息集 不在均衡路径上。 L R U 2, 2 2, 2 D 3, 1 0, 0 A B

历安毛子种枚大学 逆向归纳法 XIDIAN UNIVERSITY *逆向归纳法(Backward Induction)是求 解动态博弈纳什均的最简便方法。在求 解动态博弈纳什均斯时,从最后一个子博弈 开始逆推上去,这就是逆向归纳法。所以逆 向归纳法就是从动态博弈的最后一个阶段 或最后一个子博弈开始,逐步向前倒推以求 解动态博弈均的方法
逆向归纳法 逆向归纳法(Backward Induction)是求 解动态博弈纳什均衡的最简便方法。在求 解动态博弈纳什均衡时,从最后一个子博弈 开始逆推上去,这就是逆向归纳法。所以逆 向归纳法就是从动态博弈的最后一个阶段 或最后一个子博弈开始,逐步向前倒推以求 解动态博弈均衡的方法

历安毛子代枚大学 逆向归纳法 XIDIAN UNIVERSITY *从博弈的最后一个阶段开始分析,若B选择L获利 1,选择R获利0,因此B选L。 倒退到第一阶段,A选U获利2,选D获利取决于B 的选择。 *但A知道B是理性的,一旦 到达第二阶段,B肯定选择 D L,从而,A获利3。因此, A应该选择D。 B (2,2) A2 因此,D,L)是纯策略 R 纳什均衡。 (3.1) (0,0)
从博弈的最后一个阶段开始分析,若B选择L获利 1, 选择R获利0,因此B选L。 倒退到第一阶段,A选U获利2,选D获利取决于B 的选择 。 但A知道B是 理性的,一旦 到达第二阶段,B肯定选择 L,从而,A获利3。因此, A应该选择D。 因此,(D, L)是纯策略 纳什均衡。 逆向归纳法

历安毛子代枚大等 与策略式分析的比较 XIDIAN UNIVERSITY 逆向归纳法实际上是严格 D 下策反复删去法在扩展式 描述的动态博弈中的应用2,2) B A2 *逆向归纳法不适合无限 R 博弈。 *逆向归纳法不适合不 (3,1) (0,0) 完美信息博弈。 B L R 逆向归纳法剔出了非 U 2,2 2,2 理性的均衡策略。 D 3,1 0,0
与策略式分析的比较 逆向归纳法实际上是严格 下策反复删去法在扩展式 描述的动态博弈中的应用。 逆向归纳法不适合无限 博弈。 逆向归纳法不适合不 完美信息博弈。 逆向归纳法剔出了非 理性的均衡策略。 L R U 2, 2 2, 2 D 3, 1 0, 0 A B

历安毛子代枚大学 逆推归纳法:海盗分赃 XIDIAN UNIVERSITY 5个海盗抢来100个金币,大家决定分赃的 方式是:由海盗一提出一种分配方案,如果同 意该方案的人数达到半数,则该提议通过并实 施。否则该提议人将被扔进大海,然后由接下 来的海盗重复提议过程。 假定每个人都绝顶聪明,也不相互合作,并 且极度自私,那么第一个海盗该如何提议
逆推归纳法:海盗分赃 5个海盗抢来100个金币,大家决定分赃的 方式是:由海盗一提出一种分配方案,如果同 意该方案的人数达到半数,则该提议通过并实 施。否则该提议人将被扔进大海,然后由接下 来的海盗重复提议过程。 假定每个人都绝顶聪明,也不相互合作,并 且极度自私,那么第一个海盗该如何提议

历安毛子种枚大兽 逆推归纳法:海盗分赃 XIDIAN UNIVERSITY 逆推归纳法的求解思路如下: 。首先考虑只剩下最后一个海盗:海盗5,其他四个海盗 己经被扔进大海,显然,他会分给自己100金币,自己 同意并通过。 逆推到只剩下海盗4和海盗5的情况,海盗4会分给自己 100金币,不给海盗5分。海盗4自己同意并通过,海盗5 反对但无用。 。再回到海盗3,海盗3会给海盗5一枚金币以获取他的支 持,给自己99枚,海盗3和海盗5同意并通过
逆推归纳法的求解思路如下: 首先考虑只剩下最后一个海盗:海盗5,其他四个海盗 已经被扔进大海,显然,他会分给自己100金币,自己 同意并通过。 逆推到只剩下海盗4和海盗5的情况,海盗4会分给自己 100金币,不给海盗5分。海盗4自己同意并通过,海盗5 反对但无用。 再回到海盗3,海盗3会给海盗5一枚金币以获取他的支 持,给自己99枚,海盗 3和海盗5同意并通过。 逆推归纳法:海盗分赃

历零毛子代找大学 逆推归纳法:海盗分赃 XIDIAN UNIVERSITY 逆推归纳法的求解思路如下: 。回到海盗2,他分给海盗4一枚金币,以获 取海盗4的支持,分给海盗3和海盗5零枚 金币,海盗2和海盗4同意并通过,海盗3和 海盗5反对但无用
逆推归纳法的求解思路如下: 回到海盗2,他分给海盗4一枚 金币,以获 取海盗4的支持,分给 海盗3和海盗5零枚 金币,海盗2和海盗4同意并通过,海盗3和 海盗5 反对但无用。 逆推归纳法:海盗分赃

历安毛子代枚大等 逆推归纳法:海盗分赃 XIDIAN UNIVERSITY 逆推归纳法的求解思路如下: 。再回到海盗1,他分给海盗3和海盗5各一枚金 币以获取他的支持,给自己98枚,不分给海盗 2和海盗4,海盗1,3,和5同意并通过,海盗2 和海盗4反对但无用。 。因此,海盗分赃问题的答案是: (98,0,1,0,1),海盗1得98,海盗2和4得0,海 盗3和5各得1
逆推归纳法的求解思路如下: 再回到海盗1,他分给海盗3和海盗5各一枚金 币以获取他的支持,给自己98枚,不分给海盗 2和海盗4,海盗1,3,和5同意并通过,海盗2 和海盗4反对但无用。 因此,海盗分赃问题的答案是: (98,0,1,0,1), 海盗1得98,海盗2和4得0,海 盗3和5各得1。 逆推归纳法:海盗分赃

历安毛子代枚大学 逆推归纳法:海盗分赃 XIDIAN UNIVERSITY 海盗分赃的全过程表格表示如下: (全部海盗半数同意即可通过) 海盗1海盗2 海盗3海盗4 海盗5 海盗5 100 海盗4 100 海盗3 99 1 海盗2 99 1 海盗1 98
海盗分赃的全过程表格表示如下: (全部海盗半数同意即可通过) 海盗1 海盗2 海盗3 海盗4 海盗5 海盗5 100 海盗4 100 海盗3 99 1 海盗2 99 1 海盗1 98 1 1 逆推归纳法:海盗分赃

历安毛子代枚大等 逆推归纳法:海盗分赃 XIDIAN UNIVERSITY 。练习: 1、如果将规则改为超过半数通过,结果又 会怎样。 2、如果将规则改为除提议人之外的海盗, 超过半数通过,结果又会怎样
练习: 1、如果将规则改为超过半数通过,结果又 会怎样。 2、如果将规则改为除提议人之外的海盗, 超过半数通过,结果又会怎样。 逆推归纳法:海盗分赃
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第六讲 动态博弈分析(上).pdf
- 西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第五讲 博弈的基本分析方法(下).pdf
- 西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第四讲 博弈的基本分析方法(上).pdf
- 西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第三讲 多重均衡与优化.pdf
- 西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第二讲 博弈的分类.pdf
- 西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第一讲 博弈论简介.pdf
- 西安电子科技大学:《智能控制导论》课程教学课件(专家控制)第二讲 专家控制系统.pdf
- 西安电子科技大学:《智能控制导论》课程教学课件(专家控制)第一讲 专家系统 Expert System.pdf
- 上海海洋大学:工程学院2018版课程教学大纲汇编(电气工程及其自动化专业).pdf
- 上海海洋大学:工程学院2018版课程教学大纲汇编(机械制造及其自动化专业).pdf
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第六章 根轨迹法(2/2).ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第六章 根轨迹法(1/2).ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第五章 线性离散控制系统.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第四章 线性系统的频域分析 4.5 控制系统的相对稳定性.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第四章 线性系统的频域分析 4.4 奈奎斯特稳定判据.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第四章 线性系统的频域分析 4.3 系统开环频率特性的绘制.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第四章 线性系统的频域分析 4.2 典型环节频率特性的绘制.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第四章 线性系统的频域分析 4.1 频率特性的概念.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第三章 控制系统的时域分析法 第五节 应用MATLAB分析控制系统的性能.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第三章 控制系统的时域分析法 第四节 线性系统的稳态误差分析计算.ppt
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第一讲 绪论(主讲:吴建设).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第二讲 复杂网络的基本概念.pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第三讲 复杂网络的结构特征.pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第四讲 节点相似性.pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第五讲 复杂网络社区检测.pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第七讲 最小生成树社区检测.pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第六讲 基于网络动力学的社区检测.pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第八讲 图神经网络(上).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第九讲 图神经网络(下).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第十讲 知识表示学习(上).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第十一讲 知识表示学习(下).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(群体智能)第一讲 蜂群算法(上).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(群体智能)第一讲 蜂群算法(下).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(群体智能)第二讲 多智能体网络——多重纳什均衡.pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(群体智能)第三讲 博弈的基本分析方法.pdf
- 山东大学:电气工程及其自动化专业课程教学大纲汇编(2020年版).pdf
- 沈阳航空航天大学:自动化学院《创新创业实践》课程教学大纲.pdf
- 沈阳航空航天大学:自动化学院《传感器与检测技术》课程教学大纲.pdf
- 沈阳航空航天大学:自动化学院《电力电子技术》课程教学大纲.pdf
- 沈阳航空航天大学:自动化学院《电气控制与PLC》课程教学大纲.pdf