天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第九章 动态规划(9.1)动态规划的基本概念与方法

第一节动态规划的基本概念与方法 多阶段决策问题 1.时间阶段的例子(机器负荷问题) 某厂有1000台机器,现需作一个五年计划, 以决定每年安排多少台机器投入高负荷生产(产 量大但损耗也大)可使五年的总产量最大。 S1=1000 w $313 4
第一节 动态规划的基本概念与方法 一、多阶段决策问题 1. 时间阶段的例子(机器负荷问题) 某厂有1000台机器,现需作一个五年计划, 以决定每年安排多少台机器投入高负荷生产(产 量大但损耗也大)可使五年的总产量最大。 1 2 3 4 5 S1=1000 x1 x2 x3 x4 x5 s5 v1 v2 v3 v4 v5 s2 s3 s4

2.空间阶段的例子(最短路问题) 如图为一线路网络。现要从A点铺设一条管 道到点,图中两点间连线上数字表示两点间距 离。现需选一条由A到E的铺管线路,使总距离 最短。 B D A B 12 B311 阶段1 阶段2 阶段3 阶段4
2. 空间阶段的例子(最短路问题) 如图为一线路网络。现要从A点铺设一条管 道到E点,图中两点间连线上数字表示两点间距 离。现需选一条由A到E的铺管线路,使总距离 最短。 A E B1 B2 B3 C1 C2 C3 D1 D2 2 9 5 3 12 2 5 1 5 6 4 6 8 10 13 12 11 14 10 阶段1 阶段2 阶段3 阶段4

、基本概念与方程 1.基本概念 阶段——分步求解的过程,用阶段变量k表示,k=1,…,n 状态——每阶段初可能的情形或位置,用状态变量S表示。 按状态的取值是离散或连续,将动态规划问题分为 离散型和连续型 决策——每阶段状态确定后的抉择,即从该状态演变到下阶 段某状态的选择,用决策变量xk表示 状态转移——由S转变为Sk+1的规律,记S+1=7(S,x) 策略——由各阶段决策组成的序列,记Pn={x,,xn} 称Pm={ xn}为阶段k至n的后部子策略
二、基本概念与方程 1.基本概念 阶段——分步求解的过程,用阶段变量k表示,k=1,…,n 状态——每阶段初可能的情形或位置,用状态变量Sk表示。 按状态的取值是离散或连续,将动态规划问题分为 离散型和连续型。 决策——每阶段状态确定后的抉择,即从该状态演变到下阶 段某状态的选择,用决策变量xk表示。 状态转移——由Sk转变为Sk+1的规律,记Sk+1 =T(Sk,xk )。 策略——由各阶段决策组成的序列,记P1n={x1,…, xn }, 称Pkn={xk,…, xn }为阶段k至n的后部子策略

阶段指标—每阶段选定决策x后所产生的效益,记 Vk= V Sk. xk) 指标函数各阶段的总效益,记相应于Pn的指标函数 为V2=vm(S,Pn)。其中最优的称最优 指标函数,记f=f(Sk)= opt v 问题:动态规划的最优解和最优值各是什么? —最优解:最优策略Pn 最优值:最优指标f
阶段指标——每阶段选定决策xk后所产生的效益,记 vk= vk (Sk, xk )。 指标函数——各阶段的总效益,记相应于Pkn的指标函数 为vkn= vkn(Sk, Pkn )。其中最优的称最优 指标函数,记 fk = fk( Sk )=opt vkn。 问题:动态规划的最优解和最优值各是什么? ——最优解:最优策略P1n , 最优值:最优指标f1

2基本原理与基本方程 (1)基本原理 定理: I n =(x x")是最优策略兮对任何k(1<k<n 和允许状态s1,有1=op{1g+f1 Ak 推论(Bεlma最优性原理):若P是最优策略, 则对任何k(1<k<n),子策略P对于以s为起 点的至n子过程来说必为最优策略 以最短路为例说明
2.基本原理与基本方程 (1)基本原理 和允许状态 有 。 定理: 是最优策略 对任何 ( 1 1 1 1 1 1 1 , ( , , ) 1 ) + = + = s f opt v f P x x k k n 点的 至 子过程来说必为最优策略。 则对任何 ( ),子策略 对于以 为起 推论( 最优性原理):若 是最优策略, k n k k n P s B ellm an P 1 1 以最短路为例说明

(2)基本方程 根据最优性原理,可建立从后向前逆推求解 的递推公式基本方程: f, =opt t, +f) f=0,k=n,…,1 动态规划求解的一般步骤: 确定过程的分段,构造状态变量; 设置决策变量,写出状态转移; -列出阶段指标和指标函数; 写出基本方程,由此逐段递推求解
(2)基本方程 根据最优性原理,可建立从后向前逆推求解 的递推公式——基本方程: = = = + + + 1 0, , ,1 1 f k n f opt v f 动态规划求解的一般步骤: - 确定过程的分段,构造状态变量; - 设置决策变量,写出状态转移; - 列出阶段指标和指标函数; - 写出基本方程,由此逐段递推求解

求解方法 1.离散型(用表格方式求解) 例1用动态规划方法求解前面的最短路问题。 D
三、求解方法 1. 离散型(用表格方式求解) 例1 用动态规划方法求解前面的最短路问题。 A E B1 B2 B3 C1 C2 C3 D1 D2 2 9 5 3 12 5 2 1 5 6 4 6 8 10 13 12 11 14 10

B 14 A B E 10 B 解:设阶段k=1,2,3,4依次表示4个阶段选路的过程; 状态表示k阶段初可能处的位置; 决策x表示k阶段初可能选择的路; 阶段指标v表示k阶段与所选择的路段相应的路长; 指标函数4=∑表示k至4阶段的总路长 递推公式:f=Mm+fn} f,=0,k=4
A E B1 B2 B3 C1 C2 C3 D1 D2 2 9 5 3 12 5 2 1 5 6 4 6 8 10 13 12 11 14 10 解:设阶段k=1,2,3,4依次表示4个阶段选路的过程; 状态sk表示k阶段初可能处的位置; 决策xk表示k阶段初可能选择的路; 阶段指标vk表示k阶段与所选择的路段相应的路长; 指标函数 vk4 = 表示k至4阶段的总路长; = v 0, 4, ,1 5 1 = = = + + f k f Min v f 递推公式: k k k

B 14 2 A B2)10 E B k k kn= tfk+l f& p k D E 5+0 DE D E 2+0 DE 3+5 CD,E D k5239658 9+2 一一 3 6+5 5+2 C2D,E D 8+5 12 CDE 10 10+2
A E B1 B2 B3 C1 C2 C3 D1 D2 2 9 5 3 12 5 2 1 5 6 4 6 8 10 13 12 11 14 10 4 k Sk xk vk vkn=vk+fk+1 fk P 2 1 D D E E 2 0 5 0 + + 2 5 2 5 D E D E 2 1 3 2 1 D D 2 1 D D 2 1 D D C1 C2 C3 9 3 5 6 10 8 9 2 3 5 + + 5 2 6 5 + + 10 2 8 5 + + 8 7 12 C1D1E C2D2E C3D2E

k k k kn-vk+fk+ fk P C.12 12+8 20 B,CD,E 14 14+7 6+8 B 10 10+7 4 4+12 BCD,E 13 13+8 12 12+7 19 B,CD,E 11 11+12 、12 4 5 A 10 E 19 B
k Sk xk vk vkn=vk+fk+1 fk P A E B1 B2 B3 C1 C2 C3 D1 D2 2 9 5 3 12 5 2 1 5 6 4 6 8 10 13 12 11 14 10 2 B1 B2 B3 2 1 C C 14 12 14 7 12 8 + + 20 B1C1D1E C C C 4 10 6 4 12 10 7 6 8 + + + 14 B2C1D1E C C C 11 12 13 11 12 12 7 13 8 + + + 19 B3C2D2E
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第九章 动态规划(9.2)动态规划应用举例.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第九章 动态规划(主讲:杜纲、吴育华).ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第十三章 排队系统分析(13.5)MG1排队模型.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第十三章 排队系统分析(13.4)MMC排队模型.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第十三章 排队系统分析(13.1)排队的基本概念.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第十三章 排队系统分析.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第十三章 排队系统分析(13.3)M/M/1排队模型 十三章三节MM1排队模型.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第十三章 排队系统分析(13.6)排队系统最优化.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第十三章 排队系统分析(13.2)到达与服务的规律.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第十一章 二人有限零和对策.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第十五章 随机模拟技术.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第十四章 马尔可夫分析.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第十二章 二人有限非零和对策.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第一章 绪论(主讲:杜纲、吴育华).ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)目录(主讲:杜纲、吴育华).ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第三章 非线性规划.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第四章 多目标规划.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第六章 网络计划.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第七章 风险型决策.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第八章 库存决策.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第五章 图与网络分析(5.1)图的基本概念.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第五章 图与网络分析.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第五章 图与网络分析(5.2)网络分析.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第二章 线性规划(2.1)线性规划的模型与图解法.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第二章 线性规划.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第二章 线性规划(2.2)单纯形法.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第二章 线性规划(2.4)运输问题.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第二章 线性规划(2.5)线性整数规划.ppt
- 天津大学管理学院:《管理科学基础》课程PPT教学课件(运筹学)第二章 线性规划(2.3)对偶问题与灵敏度分析.ppt
- 武汉大学数学与统计学院:《数值分析》第一章(1.4)向量范数与矩阵范数.ppt
- 武汉大学数学与统计学院:《数值分析》第二章 求解线性方程组的数值解法(2.1)线性方程组的直接法.ppt
- 武汉大学数学与统计学院:《数值分析》第二章 求解线性方程组的数值解法(2.2)线性方程组的迭代法.ppt
- 武汉大学数学与统计学院:《数值分析》第一章(1.1)数值分析简介.ppt
- 武汉大学数学与统计学院:《数值分析》第二章 求解线性方程组的数值解法(2.3)共轭斜量法.ppt
- 武汉大学数学与统计学院:《数值分析》第三章 非线性方程的数值解法(3.1)对分法和一般迭代法.ppt
- 武汉大学数学与统计学院:《数值分析》第三章 非线性方程的数值解法(3.2)牛顿法.ppt
- 武汉大学数学与统计学院:《数值分析》第四章 插值法(4.1)Lagrange插值.ppt
- 武汉大学数学与统计学院:《数值分析》第四章 插值法(4.4)牛顿插值和Hermite插值.ppt
- 武汉大学数学与统计学院:《数值分析》第五章 函数逼近(5.1)最佳一致逼近.ppt
- 武汉大学数学与统计学院:《数值分析》第五章 函数逼近(5.2)最佳平方逼近.ppt