华北理工大学：《运筹学》课程教学课件（讲稿）第6章动态规划（Dynamic programming）

点击下载完整版文档（PDF）

文档信息

资源类别：文库
文档格式：PDF
文档页数：47
文件大小：317.52KB
团购合买：点击进入团购

内容简介

动态规划的基本思想最短路径问题投资分配问题

刷新页面文档预览

动态规划(Dynamic programming)动态规划的基本思想最短路径问题投资分配问题

动态规划 (Dynamic programming) 动态规划的基本思想最短路径问题投资分配问题

动态规划是解决多阶段最优决策的方法由美国数学家贝尔曼(R.Bellman)于1951年首先提出；1957年贝尔曼发表动态规划方面的第一部专著“动态规划”标志着运筹学的一个新分支的创立

• 动态规划是解决多阶段最优决策的方法, 由美国数学家贝尔曼(R. Bellman) 于 1951 年首先提出; • 1957年贝尔曼发表动态规划方面的第一部专著“动态规划”, 标志着运筹学的一个新分支的创立

动态规划是用来解决多阶段决策过程最优化的一种方法。其特点在于，它可以把一个n维决策问题变换为几个一维最优化问题，从而一个一个地去解决。需指出：动态规划是求解某类问题的一种方法，是考察问题的一种途径，而不是一种算法。必须对具体问题进行具体分析，运用动态规划的原理和方法，建立相应的模型，然后再用动态规划方法去求解

动态规划是用来解决多阶段决策过程最优化的一种方法。其特点在于，它可以把一个n 维决策问题变换为几个一维最优化问题，从而一个一个地去解决。需指出：动态规划是求解某类问题的一种方法，是考察问题的一种途径，而不是一种算法。必须对具体问题进行具体分析，运用动态规划的原理和方法，建立相应的模型，然后再用动态规划方法去求解

动态决策问题的特点：系统所处的状态和时刻是进行决策的重要因素：即在系统发展的不同时刻（或阶段）根据系统所处的状态，不断地做出决策；找到不同时刻的最优决策以及整个过程的最优策略，多阶段决策问题：是动态决策问题的一种特殊形式；在多阶段决策过程中，系统的动态过程可以按照时间进程分为状态相互联系而又相互区别的各个阶段每个阶段都要进行决策，目的是使整个过程的决策达到最优效果

即在系统发展的不同时刻（或阶段）根据系统所处的状态，不断地做出决策；每个阶段都要进行决策 ,目的是使整个过程的决策达到最优效果。动态决策问题的特点：系统所处的状态和时刻是进行决策的重要因素；找到不同时刻的最优决策以及整个过程的最优策略。多阶段决策问题：是动态决策问题的一种特殊形式；在多阶段决策过程中,系统的动态过程可以按照时间进程分为状态相互联系而又相互区别的各个阶段；

决策决策|决策状态状态状态状态21n多阶段决策问题的典型例子：1：生产决策问题：企业在生产过程中，由于需求是随时间变化的，因此企业为了获得全年的最佳生产效益，就要在整个生产过程中逐月或逐季度地根据库存和需求决定生产计划。2．机器负荷分配问题：某种机器可以在高低两种不同的负荷下进行生产。在高负荷下进行生产时，产品的年产量g和投入生产的机器数量u，的关系为g=g(ur)

多阶段决策问题的典型例子： 1 . 生产决策问题：企业在生产过程中，由于需求是随时间变化的，因此企业为了获得全年的最佳生产效益，就要在整个生产过程中逐月或逐季度地根据库存和需求决定生产计划。 2. 机器负荷分配问题：某种机器可以在高低两种不同的负荷下进行生产。在高负荷下进行生产时，产品的年产量 g和投入生产的机器数量 u 1的关系为 g =g ( u 1 ) 1 2 . n 状态决策状态决策状态状态决策

这时，机器的年完好率为，即如果年初完好机器的数量为u，到年终完好的机器就为au,0<a<1。在低负荷下生产时，产品的年产量h和投入生产的机器数量u的关系为h=h(u2)相应的机器年完好率b，0< b1。假定开始生产时完好的机器数量为S1。要求制定一个五年计划，在每年开始时，决定如何重新分配完好的机器在两种不同的负荷下生产的数量，使在五年内产品的总产量达到最高

这时，机器的年完好率为 a，即如果年初完好机器的数量为 u，到年终完好的机器就为au, 0< a<1 。在低负荷下生产时，产品的年产量 h和投入生产的机器数量 u 2的关系为 h = h ( u 2 ) 假定开始生产时完好的机器数量为 s1。要求制定一个五年计划，在每年开始时，决定如何重新分配完好的机器在两种不同的负荷下生产的数量，使在五年内产品的总产量达到最高。相应的机器年完好率 b, 0< b<1

3，最短路问：给定一个交通网络图如下，其中两点之间的数字表示距离（或花费），试求从A点到G点的最短距离（总费用最小）。6C28RD33B325SF55645DE83237BC366D84332456

3 . 最短路问题：给定一个交通网络图如下，其中两点之间的数字表示距离（或花费），试求从A点到G点的最短距离（总费用最小）。 1 2 3 4 5 6 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 E3 F1 F2 G 5 3 1 3 6 8 7 6 3 6 8 5 3 3 8 4 2 2 1 3 3 3 5 2 5 6 6 4 2 3

一、动态规划的基本思想（一）、基本概念1、阶段:把一个问题的过程，恰当地分为若干个相互联系的阶段，以便于按一定的次序去求解。描述阶段的变量称为阶段变量。阶段的划分，一般是然特征来进行但要便于问题转根据时间和一个数、年、月、化为多阶段一组数、路段一个向2、状态:介段开始所处状况或客观量条件。通常一段有若干个状态，描述过程状态的变量称为状态变量状态变量的取值有一定的允许集合或范围，此集合称为状态允许集合

（一）、基本概念 1、阶段：把一个问题的过程，恰当地分为若干个相互联系的阶段，以便于按一定的次序去求解。描述阶段的变量称为阶段变量。阶段的划分，一般是根据时间和空间的自然特征来进行的，但要便于问题转化为多阶段决策。 2、状态：表示每个阶段开始所处的自然状况或客观条件。通常一个阶段有若干个状态，描述过程状态的变量称为状态变量。年、月、路段一个数、一组数、一个向量状态变量的取值有一定的允许集合或范围，此集合称为状态允许集合。一、动态规划的基本思想

3、决策：表示当过程处于某一阶段的某个状态时，可以作出不同的决定，从而确定下一阶段的状态，这种决定称为决策。描述决策的变量，称为决策变量。决策变量是状态变量的函数。可用一个数、一组数或一向量（多维情形）来描述。在实际问题中决策变量的取值往往在某一范围之内，此范围称为允许决策集合。4、多阶段决策过程可以在各个阶段进行决策，去控制过程发展的多段过程；其发展是通过一系列的状态转移来实现的；系统在某一阶段的状态转移不但与系统的当前的状态和决策有关，而且还与系统过去的历史状态和决策有关

3、决策：表示当过程处于某一阶段的某个状态时，可以作出不同的决定，从而确定下一阶段的状态，这种决定称为决策。描述决策的变量，称为决策变量。决策变量是状态变量的函数。可用一个数、一组数或一向量（多维情形）来描述。在实际问题中决策变量的取值往往在某一范围之内，此范围称为允许决策集合。系统在某一阶段的状态转移不但与系统的当前的状态和决策有关，而且还与系统过去的历史状态和决策有关。 4、多阶段决策过程可以在各个阶段进行决策，去控制过程发展的多段过程；其发展是通过一系列的状态转移来实现的；

其状态转移方程如下（一般形式）状态转移方程是确定过程由一个状态到另37(8:25, 4)一个状态的演变过程如果第k阶段状态变量St的值、该阶段的决策Sk+1=T(Si,u,S2,,,Sh,uk)变量一经确定，第k+1阶段状态变量S+的值也就确定。图示如下：uk5SS k+1.12A能用动态规划方法求解的多阶段决策过程是一类特殊的多阶段决策过程，即具有无后效性的多阶段决策过程

),( ),( ),( 22111 221123 1112 kk usususTs kk ususTs usTs L LL = = = + 图示如下：状态转移方程是确定过程由一个状态到另一个状态的演变过程。如果第 k阶段状态变量 s k的值、该阶段的决策变量一经确定，第 k+1 阶段状态变量 s k+1的值也就确定。其状态转移方程如下（一般形式） 1 2 . k s 1 u 1 s 2 u 2 s 3 s k u k s k+1 能用动态规划方法求解的多阶段决策过程是一类特殊的多阶段决策过程，即具有无后效性的多阶段决策过程

共47页，可试读16页，点击继续阅读 ↓

刷新页面下载完整文档

VIP每日下载上限内不扣除下载券和下载次数；
按次数下载不扣除下载券；
注册用户24小时内重复下载只扣除一次；
顺序：VIP每日次数-->可用次数-->下载券；

点击下载完整版文档（PDF）

华北理工大学：《运筹学》课程教学课件（讲稿）第6章 动态规划（Dynamic programming）

华北理工大学：《运筹学》课程教学课件（讲稿）第6章动态规划（Dynamic programming）