1
范里安《微观经济学:现代观点》
1.29.2 【习题解析】

【习题解析】

  1.考虑重复囚徒博弈中的针锋相对策略。假设当一个参与人意在采取合作策略时却因疏忽而选择了背信策略,如果接下来两个参与人继续采取针锋相对的策略,结果会怎么样?

  【重要级别】 ☆☆         【难度级别】 ☆☆

  【考查要点】 重复博弈

  【参考答案】 所谓针锋相对的策略是指博弈双方的每一方都采取另一方在前一局的策略。在本题中,第2个参与人将以背信策略作为对第1个参与人采取的背信策略的反应。然后第1个参与人又以背信策略做出反应,因此,每个参与人都不断地以背信策略作为对另一个参与人采取的背信策略的反应。这个例子说明,当参与人误解了另一个参与人的行动,那么针锋相对并不是一个很好的策略。

  【翔高点评】 在具体的博弈分析中,注意四点:一是各方的博弈策略是什么,二是博弈的序列关系,三是博弈的信息充分性,四是博弈是否有限博弈。

  2.占优策略均衡总是纳什均衡吗?纳什均衡总是占优策略均衡吗?

  【重要级别】 ☆☆☆        【难度级别】 ☆

  【考查要点】 纳什均衡

  【参考答案】 在静态博弈中,一个参与人采取占优策略时不用考虑对手的策略(即使对方也采取占优策略)。这样,如果所有参与人都采取占优策略,将会出现给定对方的策略正是他采取的最优策略,从而形成纳什均衡。不过并非所有的纳什均衡都是占优策略均衡,如下面支付矩阵所示:

非占优均衡的纳什均衡

参与人B

参与人A

2,1

0,0

0,0

1,2

  在这个例子中,策略组合(上,左)是一个纳什均衡。但对参与人A而言,并非是其占优策略。同样,左也不是参与人B的占优策略。因此占优策略均衡是纳什均衡,但纳什均衡并不一定是占优策略。

  【翔高点评】 寻找支付矩阵的均衡解可以用画线法,即固定一方的策略选择,另一方将选择其最大的支付所对应的策略,如此重复,最后都画有线的支付所对应的向量即为均衡解。

  3.假定你的对手没有采取纳什均衡策略,那么,你还应该选择纳什均衡策略吗?

  【重要级别】 ☆          【难度级别】 ☆☆

  【考查要点】 纳什均衡

  【参考答案】 我们知道一个人的纳什均衡策略,是他在对手采用纳什均衡策略时可以选择的最优策略,但是如果对手不这么做,那么他就有可能还有更好的策略。所以答案是不一定。

  【翔高点评】 可以利用具体的博弈例子分析该问题,读者可以采取这种方法(反例法)分析很多类似的问题。

  4.我们知道,一次性的囚徒困境博弈所实现的占优纳什均衡策略是帕累托低效率的。假设我们允许两名囚徒在服刑期满后可以相互进行报复,这将影响到博弈的哪个方面?它会导致帕累托有效率吗?

  【重要级别】 ☆☆         【难度级别】 ☆☆

  【考查要点】 囚犯的难题

  【参考答案】 从形式上讲,如果允许囚徒报复,博弈中的支付矩阵收益就可能发生变化,从而使得博弈出现帕累托有效率的结果。例如,考虑两个囚徒都同意谁坦白就杀死谁,并且死亡的效用非常低,比如设定为-90,则得到下面的支付矩阵:

有报复的囚徒困境

参与人B

坦白

抵赖

参与人A

坦白

-90,-90

-90,-6

抵赖

-6,-90

-1,-1

  从上表可以看出,(-1,-1)是该博弈的唯一均衡解,而且是帕累托有效的均衡解。

  5.在一个囚徒困境重复博弈中,如果两个参与人都知道,博弈将重复100万次,那么,这个博弈的占优纳什均衡策略是什么?如果你计划采用真人按上述情景做实验,你预期他们会采取这个策略吗?

  【重要级别】 ☆☆☆        【难度级别】 ☆☆

  【考查要点】 重复博弈

  【参考答案】 这个博弈的占优纳什均衡策略是双方在每个回合都选择坦白,经验证据似乎表明参与人很少采用这一策略,该策略是通过后向归纳过程得到的,这与推导有限的10个回合所采用的方法相同。在第100万次的博弈中,双方都选择坦白,这样,给定第100万次博弈的结果是双方都选择坦白,第999999次双方还是选择坦白,以此类推,可知在该重复博弈中,双方每次都会选择坦白。

  6.假设在本章所述的序贯博弈中,由参与人B而不是参与人A先采取行动。绘制出这个新博弈的扩展形式,这个博弈的均衡是什么?参与人B偏好先采取行动还是后采取行动?

  【重要级别】 ☆☆☆        【难度级别】 ☆☆

  【考查要点】 序贯博弈

  【参考答案】 博弈的扩展型如图28.1所示。

Image

图28.1 博弈的扩展型

  博弈的均衡是B选择左边,A选择上边,相应的支付是(9,1)。

  利用逆向递推法:先看A的选择,如果B选择左边,则A选择上边,因为获得的9大于选择下边获得的支付0;如果B选择右边,则A选择下边,因为获得的支付2大于获得的支付1;这样如果B选左边,由于A会选择上边,则B能得到支付9;如果B选择右边,则A会选择下边,B只能得到支付1,所以B肯定只会选左边,从而A就会选上边。因此博弈的均衡是B选择左边,参与人A选择上边,相应的支付是(9,1)。

  参与人B愿意先采取行动,因为由此产生的收益是9,而不是没有先采取行动时所得到的支付1。

  【翔高点评】 序贯博弈中会出现先发优势或者后发优势,分析该问题的最好工具就是博弈树。