西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第二讲 博弈的分类

历些毛子代枝大学 XIDIAN UNIVERSITY 博弈的分类 1、合作博弈与非合作博弈 2、完全信息博弈与不完全信息博弈 3、静态博弈与动态博弈 相互组合: 完全信息静态博弈、完全信息动态博弈、 不完全信息静态博弈、不完全信息动态博 弈。 4、纯策略博弈与混合策略博弈
博弈的分类 1、合作博弈与非合作博弈 2、完全信息博弈与不完全信息博弈 3、静态博弈与动态博弈 相互组合: 完全信息静态博弈、完全信息动态博弈、 不完全信息静态博弈、不完全信息动态博 弈。 4、纯策略博弈与混合策略博弈

历些毛子代拔大学 、合作博弈与非合作博弈 XIDIAN UNIVERSITY 一个例子(投票博弈):懂事会由4名懂事组成, 懂事长、副董事长、懂事1、懂事2。在懂事会进行表 决时,董事长有3票,副董事长有2票,两名董事各有 1票。投票规则规定,赞成票过半数,表决的议题通 过。 ,在这个博弈中任何一个人都不能单独使议题通过,需 要与人合作。 >在合作博弈中,将参与人集合N={1,…,n}中的任何 一个子集,即S二N,称为博弈中的一个联盟(coalition), 特别的S=N称为一个大联盟
1、合作博弈与非合作博弈 一个例子(投票博弈):懂事会由4名懂事组成, 懂事长、副董事长、懂事1、懂事2。在懂事会进行表 决时,董事长有3票,副董事长有2票,两名董事各有 1票。投票规则规定,赞成票过半数,表决的议题通 过。 在这个博弈中任何一个人都不能单独使议题通过,需 要与人合作。 在合作博弈中,将参与人集合N={1, … ,n}中的任何 一个子集,即S⊆N,称为博弈中的一个联盟(coalition), 特别的S=N 称为一个大联盟

历安毛子代枚大等 1、合作博弈与非合作博弈 XIDIAN UNIVERSITY 特征函数v(S)是指联盟S中的全体成员所能创 造的最大价值。特征函数满足以下条件: v(0)=0 v()≤N) 台 ■第一个条件:联盟是空集,则不创造任何价值 ■第二个条件:大联盟创造的价值不低于参与人单独创造 的价值之和。 ,上述投票博弈的函数式: 0 q:<4 V(s)= q:≥4 台
1、合作博弈与非合作博弈 特征函数v(S)是指联盟S中的全体成员所能创 造的最大价值。特征函数满足以下条件: v(Ø)=0 第一个条件:联盟是空集,则不创造任何价值 第二个条件:大联盟创造的价值不低于参与人单独创造 的价值之和。 上述投票博弈的函数式:

历些毛子代枝大票 1、合作博弈与非合作博弈 XIDIAN UNIVERSITY >合作博弈:合作博弈亦称为正和博弈,是指博弈双 方的利益都有所增加,或者至少是一方的利益增加, 而另一方的利益不受损害,因而整个集体的利益有所 增加。 ,合作博弈研究人们达成合作时如何分配合作得到的收 益,即收益分配问题。合作博弈采取的是一种合作的 方式,或者说是一种妥协。 ,至于收益在博弈各方之间如何分配,取决于博弈各方 的力量对比和技巧运用。因此,妥协必须经过博弈各 方的讨价还价,达成共识,进行合作
1、合作博弈与非合作博弈 合作博弈:合作博弈亦称为正和博弈,是指博弈双 方的利益都有所增加,或者至少是一方的利益增加, 而另一方的利益不受损害,因而整个集体的利益有所 增加。 合作博弈研究人们达成合作时如何分配合作得到的收 益,即收益分配问题。合作博弈采取的是一种合作的 方式,或者说是一种妥协。 至于收益在博弈各方之间如何分配,取决于博弈各方 的力量对比和技巧运用。因此,妥协必须经过博弈各 方的讨价还价,达成共识,进行合作

历些毛子代枝大皇 1、合作博弈与非合作博 XIDIAN UNIVERSITY 合作博弈存在的两个基本条件是: (1)对联盟来说,整体收益大于其每个成员单 独经营时的收益之和。 (2)对联盟内部而言,应存在具有帕累托改进 性质的分配规则,即每个成员都能获得比 不加入联盟时多一些的收益
1、合作博弈与非合作博 合作博弈存在的两个基本条件是: (1)对联盟来说,整体收益大于其每个成员单 独经营时的收益之和。 (2)对联盟内部而言,应存在具有帕累托改进 性质的分配规则,即每个成员都能获得比 不加入联盟时多一些的收益

历些毛子代枝大兽 、合作博弈与非合作博弈 XIDIAN UNIVERSITY 合作博弈的例子: 。 OPEC(国际石油输出国组织),合作限产来共同增加利 润。他们控制了绝大部分石油储量,谁不遵守组织内部 协定,就予以一定制裁。 ,假如一个区域里有沃尔玛、家乐福、红旗、家润多、人 人乐几个大型超市。由于太集中了,经常打促销战,造 成销售净利率下降。为此,他们组成一个价格联盟来限 制各自竞争行为。然后设置了一个惩罚机制
1、合作博弈与非合作博弈 合作博弈的例子 : OPEC(国际石油输出国组织),合作限产来共同增加利 润。他们控制了绝大部分石油储量,谁不遵守组织内部 协定,就予以一定制裁。 假如一个区域里有沃尔玛、家乐福、红旗、家润多、人 人乐几个大型超市。由于太集中了,经常打促销战,造 成销售净利率下降。为此,他们组成一个价格联盟来限 制各自竞争行为。然后设置了一个惩罚机制

历安毛子代枚大等 1、合作博弈与非合作博弈 XIDIAN UNIVERSITY 非合作博弈:在参与人利益相互冲突中如 何选择策略使自己的收益最大,即策略选 择问题。是一种不可能达成具有约束力的 协议的博弈类型。 >零和博弈、负和博弈是非合作博弈。 囚徒困境是非合作博弈
1、合作博弈与非合作博弈 非合作博弈:在参与人利益相互冲突中如 何选择策略使自己的收益最大,即策略选 择问题。是一种不可能达成具有约束力的 协议的博弈类型。 零和博弈、负和博弈是非合作博弈。 囚徒困境是非合作博弈

历些毛子科枚大学 1、合作博弈与非合作博弈 XIDIAN UNIVERSITY 。囚徒困境是非合作博弈。 D C T S D -5-5 0-10 RR C -10 -1-1 T>R>P>S.2R>T+S ●如果将囚徒困境博弈中的参数改成:R>T,会怎样?
1、合作博弈与非合作博弈 囚徒困境是非合作博弈。 D C D C D D C C -5 -5 0 -10 -10 0 -1 -1 P P T S S T R R T>R>P>S, 2R>T+S 如果将囚徒困境博弈中的参数改成: R>T,会怎样?

历安毛子代枚大等 完全信息与不完全信息博弈 XIDIAN UNIVERSITY >完全信息博弈:是指每一参与者都拥有所 有其他参与者的特征、策略及收益函数等 方面的准确信息的博弈。 ,不完全信息博弈,参与人并不完全清楚有 关博弈的一些信息
2、完全信息与不完全信息博弈 完全信息博弈:是指每一参与者都拥有所 有其他参与者的特征、策略及收益函数等 方面的准确信息的博弈。 不完全信息博弈,参与人并不完全清楚有 关博弈的一些信息

历安毛子代枚大学 2、完全信息与不完全信息博弈 XIDIAN UNIVERSITY >不完全信息博弈的例子: 。讨价还价中,买主不知道卖主的最低要加,卖 主也不知道买主的最高出价; ·参与投标的各个厂商不知道其它人的出价: ·二手车市场,买家不知道车的真实情况: 二人竞争一个工作岗位,彼此不知道对方情况;
2、完全信息与不完全信息博弈 不完全信息博弈的例子: 讨价还价中,买主不知道卖主的最低要加,卖 主也不知道买主的最高出价; 参与投标的各个厂商不知道其它人的出价; 二手车市场,买家不知道车的真实情况; 二人竞争一个工作岗位,彼此不知道对方情况;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第一讲 博弈论简介.pdf
- 西安电子科技大学:《智能控制导论》课程教学课件(专家控制)第二讲 专家控制系统.pdf
- 西安电子科技大学:《智能控制导论》课程教学课件(专家控制)第一讲 专家系统 Expert System.pdf
- 上海海洋大学:工程学院2018版课程教学大纲汇编(电气工程及其自动化专业).pdf
- 上海海洋大学:工程学院2018版课程教学大纲汇编(机械制造及其自动化专业).pdf
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第六章 根轨迹法(2/2).ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第六章 根轨迹法(1/2).ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第五章 线性离散控制系统.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第四章 线性系统的频域分析 4.5 控制系统的相对稳定性.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第四章 线性系统的频域分析 4.4 奈奎斯特稳定判据.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第四章 线性系统的频域分析 4.3 系统开环频率特性的绘制.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第四章 线性系统的频域分析 4.2 典型环节频率特性的绘制.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第四章 线性系统的频域分析 4.1 频率特性的概念.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第三章 控制系统的时域分析法 第五节 应用MATLAB分析控制系统的性能.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第三章 控制系统的时域分析法 第四节 线性系统的稳态误差分析计算.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第三章 控制系统的时域分析法 第三节 劳斯-霍尔维茨稳定性判据.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第三章 控制系统的时域分析法 第一节 二阶系统的瞬态响应及性能指标.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第二章 控制系统数学模型 第四节 控制系统结构图与信号流图.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第二章 控制系统数学模型 第二节 控制系统的复数域数学模型.ppt
- 吉林大学:《自动控制原理》课程电子教案(PPT课件)第二章 控制系统数学模型 第一节 控制系统的时域数学模型.ppt
- 西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第三讲 多重均衡与优化.pdf
- 西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第四讲 博弈的基本分析方法(上).pdf
- 西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第五讲 博弈的基本分析方法(下).pdf
- 西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第六讲 动态博弈分析(上).pdf
- 西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第七讲 动态博弈分析(下).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第一讲 绪论(主讲:吴建设).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第二讲 复杂网络的基本概念.pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第三讲 复杂网络的结构特征.pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第四讲 节点相似性.pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第五讲 复杂网络社区检测.pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第七讲 最小生成树社区检测.pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第六讲 基于网络动力学的社区检测.pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第八讲 图神经网络(上).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第九讲 图神经网络(下).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第十讲 知识表示学习(上).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(复杂网络)第十一讲 知识表示学习(下).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(群体智能)第一讲 蜂群算法(上).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(群体智能)第一讲 蜂群算法(下).pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(群体智能)第二讲 多智能体网络——多重纳什均衡.pdf
- 西安电子科技大学:《复杂网络与群体智能》课程教学课件(群体智能)第三讲 博弈的基本分析方法.pdf