第二节完全不确定型决策
完全不确定型决策:指当决策者能掌握可能出现的各种状态,并且知道将采用的几种行动方案在各种不同状态下所获得的相应的收益值,但不能估计各自然状态出现概率时的决策。也叫概率未知情况下的决策。这时,决策者根据自己的主观倾向决策,由决策者得主观态度可以有:“好中求好”的决策方法;“坏中求好”的决策方法;系数决策方法;“最小的最大后悔值”决策方法;等概率决策方法。
9.2.1“好中求好”决策准则
“好中求好”决策准则:又叫乐观决策准则,或称“最大最大”决策准则,这种决策准则就是充分考虑可能出现的最大利益,在各最大利益中选取最大者,将其对应的方案作为最优方案。
“好中求好”决策准则的步骤:
(1)确定各种可行方案;
(2)确定决策问题将面临的各种自然状态。
(3)将各种方案在各种自然状态下的损益值列于决策矩阵表中。
(4)求出每一方案在各自然状态下的最大损益值,填写在决策矩阵表的最后一列。
(5)在这些最大损益值即决策矩阵表的最后一列中取最大值
,所对应的
方案为最佳决策方案。如果损益矩阵是损失矩阵,则采取“最小最小”决策准则,即取
对应的方案
为最佳决策方案。
【例9.1】设某工厂是按批生产某产品并按批销售,每件产品的成本为30元,批发价格为每件35元,若每月生产的产品当月销售不完,则每件损失1元。工厂每投产一批是10件,最大月生产能力是40件,决策者可选择的生产方案为0,10,20,30,40五种,假设决策者对其产品的需求情况一无所知,试问这时决策者如何决策?
按照上述步骤,可知决策者得行动方案有5种,这是他的策略集合,记为
,
,经分析可断定对应的销售情况有五种,即0,10,20,30,40,50,这就是自然状态,但不知道它们发生的概率,这就是事件集合,记作
,
。根据相应的数据,可算出不同策略在不同自然状态下的收益值,如计算月产量为30,而销量只有10时,损益值为:
(元)
这样,将结果汇总得到表9-1。
表9-1不同策略在不同自然状态下的收益值
|
| 状态 | |||||
| 0 | 10 | 20 | 30 | 40 | ||
| 策
略 | 0 10 20 30 40 | 0 -10 -20 -30 -40 | 0 50 40 30 20 | 0 50 100 90 80 | 0 50 100 150 140 | 0 50 100 150 200 |
按照“好中求好”原则,可知选择生产40件的方案。这反映了决策者是一种乐观心态,事件的发生总是从最好的方面出现,所以这种决策原则也成为乐观主义决策准则。
9.2.2“坏中求好”决策准则
“坏中求好”决策准则:又叫小中取大准则,或称悲观决策准则,这种决策准则就是充分考虑可能出现的最坏情况,从每个方案的最坏结果中选择一个最佳值,将其对应的方案作为最优方案。
“坏中求好”决策准则的步骤:
(1)确定各种可行方案;
(2)确定决策问题将面临的各种自然状态。
(3)将各种方案在各种自然状态下的损益值列于决策矩阵表中。
(4)求出每一方案在各自然状态下的最小损益值。
(5)在这些最小损益值中取最大值
,所对应的方案
为最佳决策方案。如果损益矩阵是损失矩阵,则采取“最大最小”决策准则,即取
对应的方案
为最佳决策方案。
按照这个原则,可以得出最优决策策略是:“什么也不生产”,这结论似乎很荒唐,但在实际中表示先看一看,以后再做决定。这个决策原则,反映了决策者对事物的态度一般是比较悲观的,所以也称为悲观主义准则。
9.2.3“最小的最大后悔值”决策方法
“最小的最大后悔值”决策方法:是决策者先计算出各方案在不同自然状态下的后悔值,也称机会损失值,其含义是:当某一事件发生后,由于决策者没有选用收益最大的策略,而形成的损失值。然后分别找出各方案对应不同自然状态下的后悔值中最大值,最后从这些最大后悔值中找出最小的最大后悔值,将其对应的方案作为最优方案。
“最小的最大后悔值”决策方法的步骤:
(1)确定各种可行方案;
(2)确定决策问题将面临的各种自然状态。
(3)将各种方案在各种自然状态下的损益值列于决策矩阵表中。
(4)计算每一种方案在不同自然状态下的后悔值,即每种自然状态下的最大收益值与该自然状态下的其他收益之差。
(5)每一种方案在各自然状态下都有一个后悔值,对某一方案,找出各自然状态下的后悔值中最大的一个,就是该方案的最大后悔值。
(6)每一个方案都有一个最大后悔值,从中找出最小的一个后悔值,其对应的方案就是“最小的最大后悔值”决策的最优方案。
对上例我们有:若发生k事件,各策略的收益为
,
,其中最大者为![]()
这时各策略的机会成本的损失值为:
,![]()
计算结果为表9-2。
表9-2 “最小的最大后悔值”决策
|
| 状态 | max | |||||
| 0 | 10 | 20 | 30 | 40 | |||
|
策
略
| 0 10 20 30 40 | 0 -10 -20 -30 -40 | 50 0 10 20 30 | 100 50 0 10 20 | 150 100 50 0 10 | 200 150 100 50 0 | 200 150 100 50 30 |
从所有最大后悔者选择最小的,它对应的策略为生产40件。
9.2.4
系数决策准则
当用“坏中求好”和“好中求好”决策准则处理问题,有的决策者认为这样太极端,于是把这两种决策结合起来,令
表示乐观系数,
,并用以下关系式表示:
![]()
分别表示第
各策略可能得到的最大收益与最小收益,然后选择最大的
。我们称之为系数决策准侧。系数决策准则是对“坏中求好”和“好中求好”决策准则进行折衷的一种决策准则。系数依决策者认定情况是乐观还是悲观而取不同的值。若
=1,则认定情况完全乐观;
,则认定情况完全悲观;一般情况下,则
。
系数决策准则的步骤:
(1)确定各种可行方案;
(2)确定决策问题将面临的各种自然状态。
(3)将各种方案在各种自然状态下的损益值列于决策矩阵表中。
(4)求出每一方案在各自然状态下的最大损益值和最小损益值。
(5)给定
,
,令
![]()
![]()
取对应的方案
为最佳决策方案。
实际工作中采用哪一种决策方法有相当程度的主观随意性。一般来说,“坏中求好”决策方法主要由那些比较保守稳妥并害怕承担较大风险的决策者所采用;“好中求好”决策方法主要是由那些对有利情况的估计比较有信心的决策者所采用;系数决策方法主要由那些对形势判断既不乐观也不太悲观的决策者所采用;“最小的最大后悔值”决策方法主要由那些对决策失误的后果看得较重的决策者所采用。在实际决策中,当决策者面临不确定性决策问题时,他首先是获取各事件发生的信息,将不确定性决策问题转化为风险决策。

