主题:【整理】管理科学简单概念介绍1 -- wqnsihs
8、动态规划
研究多段(多步)决策过程最优化问题的一种数学方法,是最优控制和运筹学的重要数学工具。
为了寻找系统最优决策,可将系统运行过程划分为若干相继的阶段(或若干步),并在每个阶段(或每一步)都作出决策。这种决策过程就称为多段(多步)决策过程。多段决策过程的每一阶段的输出状态就是下一阶段的输入状态。某一阶段所作出的最优决策,对于下一阶段未必是最有利的。多段决策过程的最优化问题必须从系统整体出发,要求各阶段选定的决策序列所构成的策略最终能使目标函数达到极值。
(1)、简史
20世纪40年代,科学家开始研究水力资源的多级分配和库存的多级存储问题。50年代初,美国数学家R.贝尔曼首先提出动态规划的概念,1957年发表《动态规划》一书。在1961、1962年相继出版的第二版和第三版中,又进一步阐明了动态规划的理论和方法。
(2)、多段决策过程
多段决策过程包括阶段、状态、决策、策略和目标函数 5个要素。
①阶段:把所要求解的过程划分成若干相互联系的阶段,并用□表示阶段变量。
②状态:表示某一阶段出发位置的状态,它既是上一阶段的输出又是本阶段的输入,并用向量□k表示第□阶段的状态,称为状态变量。
③决策:指给定□阶段的状态后,从该状态转移到下一阶段某一状态的选择。用U□表示第□阶段当状态处于X□时的决策变量。对于系统的每一个状态,都可以从若干种可能的决策(或控制)中任选一种。选定决策并加以实施,即可引起系统状态的变化。系统的下一阶段状态由现在的状态和决策确定,与过去的历史无关,即系统是无记忆的。
④策略:由过程中每一阶段所选决策构成的整个序列,又称为方案。
⑤目标函数:策略的目标是使状态变量的某个特定函数的值为最大(或最小)。这个特定函数就是目标函数。使目标函数值为最大(或最小)的策略称为最优策略。
(3)、基本原理
动态规划的理论基础是最优化原理和嵌入原理。
最优化原理:一个最优策略,具有如下性质:不论初始状态和初始决策(第一步决策)如何,以第一步决策所形成的阶段和状态作为初始条件来考虑时,余下的决策对余下的问题而言也必构成最优策略。最优化原理体现了动态规划方法的基本思想。
嵌入原理:一个具有已知初始状态和固定步数的过程总可以看作是初始状态和步数均不确定的一族过程中的一个特殊情况。这种把所研究的过程嵌入一个过程族的原理称为嵌入原理。通过研究过程族的最优策略族的共同性质得出一般通解,此通解自然也适用于原来的特殊问题。动态规划的基本方法就是根据嵌入原理把一个多步决策问题化为一系列较简单的一步决策问题,可显著降低数学处理上的难度。
应用最优化原理和嵌入原理可推导出动态规划的基本方程,称为贝尔曼方程。(请上网搜索数学表达式)
贝尔曼方程是关于未知函数(目标函数)的函数方程组。应用最优化原理和嵌入原理建立函数方程组的方法称为函数方程法。在实际运用中要按照具体问题寻求特殊解法。动态规划理论开拓了函数方程理论中许多新的领域。
(4)、应用
若多阶段决策过程为连续型,则动态规划与变分法处理的问题有共同之处。动态规划原理可用来将变分法问题归结为多阶段决策过程,用动态规划的贝尔曼方程求解。在最优控制理论中动态规划方法比极大值原理更为适用。但动态规划还缺少严格的逻辑基础。60年代,沃尔昌斯基对动态规划方法作了数学论证。动态规划方法有五个特点:
①在策略变量较多时,与策略穷举法相比可降低维数;
②在给定的定义域或限制条件下很难用微分方法求极值的函数,可用动态规划方法求极值;
③对于不能用解析形式表达的函数,可给出递推关系求数值解;
④动态规划方法可以解决古典方法不能处理的问题,如两点边值问题和隐变分问题等;
⑤许多数学规划问题均可用动态规划方法来解决,例如,含有随时间或空间变化的因素的经济问题。投资问题、库存问题、生产计划、资源分配、设备更新、最优搜索、马尔可夫决策过程,以及最优控制和自适应控制等问题,均可用动态规划方法来处理。
9、经典控制理论
自动控制理论中建立在频率响应法和根轨迹法基础上的一个分支。经典控制理论的研究对象是单输入、单输出的自动控制系统,特别是线性定常系统。经典控制理论的特点是以输入输出特性(主要是传递函数)为系统数学模型,采用频率响应法和根轨迹法这些图解分析方法,分析系统性能和设计控制装置。经典控制理论的数学基础是拉普拉斯变换,占主导地位的分析和综合方法是频率域方法。经典控制理论主要研究系统运动的稳定性、时间域和频率域中系统的运动特性、控制系统的设计原理和校正方法。经典控制理论包括线性控制理论、采样控制理论、非线性控制理论三个部分。早期,这种控制理论常被称为自动调节原理,随着以状态空间法为基础和以最优控制理论为特征的现代控制理论的形成(在1960年前后),开始广为使用现在的名称。
1868年,英国科学家J.C.麦克斯韦首先解释了瓦特速度控制系统中出现的不稳定现象,指出振荡现象的出现同由系统导出的一个代数方程根的分布形态有密切的关系,开辟了用数学方法研究控制系统中运动现象的途径。英国数学家E.J.劳思和德国数学家A.胡尔维茨推进了麦克斯韦的工作,分别在1875年和1895年独立地建立了直接根据代数方程的系数判别系统稳定性的准则。
1932年,美国物理学家H.奈奎斯特运用复变函数理论的方法建立了根据频率响应判断反馈系统稳定性的准则。这种方法比当时流行的基于微分方程的分析方法有更大的实用性,也更便于设计反馈控制系统。奈奎斯特的工作奠定了频率响应法的基础。随后,H.W.波德和N.B.尼科尔斯等在30年代末和40年代进一步将频率响应法加以发展,使之更为成熟,经典控制理论遂开始形成。
1948年,美国科学家W.R.埃文斯提出了名为根轨迹的分析方法,用于研究系统参数(如增益)对反馈控制系统的稳定性和运动特性的影响,并于1950年进一步应用于反馈控制系统的设计,构成了经典控制理论的另一核心方法──根轨迹法。
40年代末和50年代初,频率响应法和根轨迹法被推广用于研究采样控制系统和简单的非线性控制系统,标志着经典控制理论已经成熟。经典控制理论在理论上和应用上所获得的广泛成就,促使我们试图把这些原理推广到像生物控制机理、神经系统、经济及社会过程等非常复杂的系统,其中美国数学家N.维纳在1948年出版的《控制论》最为重要和影响最大。
经典控制理论在解决比较简单的控制系统的分析和设计问题方面是很有效的,至今仍不失其实用价值。存在的局限性主要表现在只适用于单变量系统,且仅限于研究定常系统。
10、现代控制理论
现代控制理论是建立在状态空间法基础上的。在现代控制理论中,对控制系统的分析和设计主要是通过对系统的状态变量的描述来进行的,基本的方法是时间域方法。现代控制理论比经典控制理论所能处理的控制问题要广泛得多,包括线性系统和非线性系统,定常系统和时变系统,单变量系统和多变量系统。它所采用的方法和算法也更适合于在计算机上进行。现代控制理论还为设计和构造具有指定的性能指标的最优控制系统提供了可能性。现代控制理论的名称是在1960年以后开始出现的,用以区别当时已经相当成熟并在后来被称为经典控制理论的那些方法。现代控制理论已在航空航天技术、军事技术、通信系统、生产过程等方面得到广泛的应用。现代控制理论的某些概念和方法,还被应用于人口控制、交通管理、生态系统、经济系统等的研究中。
(1)、简史
现代控制理论是在20世纪50年代中期迅速兴起的空间技术的推动下发展起来的。空间技术的发展迫切要求建立新的控制原理,以解决诸如把宇宙火箭和人造卫星用最少燃料或最短时间准确地发射到预定轨道一类的控制问题。这类控制问题十分复杂,采用经典控制理论难以解决。
1958年,苏联数学家庞特里亚金提出了著名的极大值原理成为综合控制系统的新方法。在这之前,美国学者R.贝尔曼于1954年创立了动态规划,并在1956年应用于控制过程。他们的研究成果解决了空间技术中出现的复杂控制问题,并开拓了控制理论中最优控制理论这一新的领域。
1960~1961年,美国学者R.E.卡尔曼和R.S.布什建立了卡尔曼--布什滤波理论,因而有可能有效地考虑控制问题中所存在的随机噪声的影响,把控制理论的研究范围扩大,包括了更为复杂的控制问题。几乎在同一时期内,贝尔曼、卡尔曼等人把状态空间法系统地引入控制理论中。状态空间法对揭示和认识控制系统的许多重要特性具有关键的作用。其中能控性和能观测性尤为重要,成为控制理论两个最基本的概念。
到60年代初,一套以状态空间法、极大值原理、动态规划、卡尔曼-布什滤波为基础的分析和设计控制系统的新的原理和方法已经确立,这标志着现代控制理论的形成。
(2)、线性系统理论
是现代控制理论中最为基本和比较成熟的一个分支,着重于研究线性系统中状态的控制和观测问题,其基本的分析和综合方法是状态空间法。按所采用的数学工具,线性系统理论通常分成为三个学派:基于几何概念和方法的几何理论,代表人物是W.M.旺纳姆;基于抽象代数方法的代数理论,代表人物是R.E.卡尔曼;基于复变量方法的频域理论,代表人物是H.H.罗森布罗克。
(2)、非线性系统理论
非线性系统的分析和综合理论尚不完善。研究领域主要还限于系统的运动稳定性、双线性系统的控制和观测问题、非线性反馈问题等。更一般的非线性系统理论还有待建立。从70年代中期以来,由微分几何理论得出的某些方法对分析某些类型的非线性系统提供了有力的理论工具。
(3)、最优控制理论
最优控制理论是设计最优控制系统的理论基础,主要研究受控系统在指定性能指标实现最优时的控制规律及其综合方法。在最优控制理论中,用于综合最优控制系统的主要方法有极大值原理和动态规划。最优控制理论的研究范围正在不断扩大,诸如大系统的最优控制、分布参数系统的最优控制等。
(4)、随机控制理论
随机控制理论的目标是解决随机控制系统的分析和综合问题。维纳滤波理论和卡尔曼-布什滤波理论是随机控制理论的基础之一。随机控制理论的一个主要组成部分是随机最优控制,这类随机控制问题的求解有赖于动态规划的概念和方法。
(5)、适应控制理论
适应控制系统是在模仿生物适应能力的思想基础上建立的一类可自动调整本身特性的控制系统。适应控制系统的研究常可归结为如下的三个基本问题:
①识别受控对象的动态特性;
②在识别对象的基础上选择决策;
③在决策的基础上做出反应或动作。
11、资源最优配置的规划计划预算系统
美国国防部为了达到合理分配和使用资源,对规划、计划和预算进行系统管理(PPBS),于1961年首先创用,1965年被应用到民政部门和企业界,后在西欧和加拿大、日本等国得到广泛应用,取得明显效果。
(1)、背景
原来美国国防部的研究开发计划和预算编制分别由两个系统进行。前者一般按军种和任务分类,由从事作战参谋工作的军职人员制订后交参谋长联席会议汇总。这类计划一般不作成本费用的计算和详细的财务说明,而且往往是预测未来若干年的长期规划。
后者则按职能机构分类,由三军文职部长和各级审计人员负责编制,它以国家当年财力为预算准则,而且只预算未来一年的短期需求。
这两个系统互不联系,以致造成研制计划与预算工作的脱节。其结果或者是追加预算,造成超支;或者是取消已经执行的计划,造成浪费。为了克服这些缺点,便于高级领导人员对研究开发工作进行监督和管理,美国国防部委托兰德公司进行研究。最后由兰德公司研究出这种系统管理方法,并在国防部内成立系统分析机构协助推行。
(2)、PPBS组成
把制订决策过程中的规划、计划和预算三个阶段合成一个总体系统来统一考虑,并设计一套工作文件来沟通各阶段工作,建立管理信息系统以储存、传递和反馈各部门间的有关信息。它的基本观点是年度财政预算必须以计划和规划为依据。计划和规划必须根据任务和需求,而任务和需求又必须根据国家最高目标的优先顺序来确定。PPBS由 3个部分组成。
①规划:主要是确定综合性的战略目标和研制规划,据此制订实现这些目标和规划的若干备选方案,并对这些备选方案进行费用效益分析,最终求得资源分配的最优方案。
②计划:把战略目标分解为若干具体目标,并制订实施这些目标的有关方案,并把规划中的任务和需求制订出五年计划和年度计划,对所需的各种资源作出估算等,最后报请上级批准。
③预算:以计划为依据制订每年的预算,分配资金。为了便于把计划与预算工作结合起来,两者在结构上完全相同,即计划中每一项目中的任务必须在相应的预算项目中支取经费。根据每个项目的费用水平进行财务检查,一般不允许超支,只有经过特别批准才可追加预算。下图为PPBS所用的基本方法、工作和文件。
(3)、PPBS的基本特征
①首先树立明确的长期的总体发展目标。
②从这些目标中选择最主要和最迫切的任务。
③利用系统分析选出实现主要目标的最优方案。
④不但要制订长期费用计划,而且要订出年度预算,便于执行和检查。
⑤要衡量各项计划方案的实施成效,保证资金得到最有效的利用。
⑥整个工作过程大量应用了预算技术、系统分析、滚动计划等方法,以加强规划工作的预见性和科学性。
(完)
本帖一共被 1 帖 引用 (帖内工具实现)
- 相关回复 上下关系8
🙂广告:忙总掏干货了 1 testjhy 字54 2010-05-16 03:09:05
🙂忙总一直在掏干货啊 wxmang的书童甲 字6 2010-05-16 03:39:53
🙂绝大多数是以前听课笔记,少量是以后看到的东西。 wqnsihs 字0 2010-05-16 03:12:54
🙂【整理】管理科学简单概念介绍4
🙂送花送到没经验,还是要赞一个! 无知者 字0 2010-05-17 06:22:04
🙂【整理】管理科学简单概念介绍3 37 wqnsihs 字9721 2010-05-16 02:50:22
🙂忙总大作,一定要支持! tommywu 字52 2010-05-17 18:35:58
🙂清晨有宝,谢忙总 小道士 字121 2010-05-16 17:56:36