博弈论

顾倩倩

目录

  • 1 导论
    • 1.1 考核方式
    • 1.2 教材及参考书目
    • 1.3 绪论:初识博弈论
      • 1.3.1 什么是博弈论?
      • 1.3.2 理论发展史
      • 1.3.3 博弈论就在你身边
      • 1.3.4 课程主要内容
      • 1.3.5 学习博弈论的意义
  • 2 走进博弈论:从故事开始
    • 2.1 课程导入
    • 2.2 博弈的定义
    • 2.3 博弈的构成要素
    • 2.4 抓钱博弈
    • 2.5 博弈的基本分类
    • 2.6 小结
  • 3 囚徒困境
    • 3.1 囚徒困境:自愿坐牢的嫌疑人
      • 3.1.1 完全信息静态博弈
      • 3.1.2 囚徒困境博弈
      • 3.1.3 相对优势策略划线法
      • 3.1.4 纳什均衡
      • 3.1.5 现实中的囚徒困境
      • 3.1.6 小结
      • 3.1.7 ★拓展案例:生活中的博弈论
      • 3.1.8 第3周 录播视频
    • 3.2 囚徒困境的人生哲学
      • 3.2.1 如何走出囚徒困境?
      • 3.2.2 帯剑的契约才有效
      • 3.2.3 重复博弈:变心与长相厮守
      • 3.2.4 小结
    • 3.3 囚徒困境的扩展应用
      • 3.3.1 智猪博弈
      • 3.3.2 人质困境
      • 3.3.3 公共资源悲剧
      • 3.3.4 旅行者困境
      • 3.3.5 ★拓展案例:囚徒困境在企业竞争中的应用
  • 4 零和博弈
    • 4.1 零和博弈
    • 4.2 最小最大法
    • 4.3 直线交叉法*
    • 4.4 小结
    • 4.5 ★拓展案例:邻里之间的争执
  • 5 蜈蚣博弈:从终点出发的思维
    • 5.1 蜈蚣博弈及其悖论
    • 5.2 海盗分金案例
    • 5.3 人生的倒后推理
    • 5.4 选择决定人生
  • 6 酒吧博弈:混沌系统中的策略
    • 6.1 酒吧博弈
    • 6.2 非线性系统:一加一并不等于二
    • 6.3 分阶段实现人生目标
    • 6.4 少数者策略
  • 7 讨价还价博弈:把自己变成谈判高手
    • 7.1 引入
    • 7.2 讨价还价模型阐述
    • 7.3 讨价还价博弈的智慧
  • 8 猎鹿博弈的合作哲学
    • 8.1 引入:银行挤兑风波
    • 8.2 猎鹿博弈的理论模型
    • 8.3 帕累托均衡
    • 8.4 猎鹿博弈的启示
    • 8.5 ★拓展案例:为什么薄饼和冰激凌一起卖更受欢迎?
  • 9 枪手博弈
    • 9.1 引入:后汉三国的局势
    • 9.2 枪手博弈
    • 9.3 枪手博弈的启示
    • 9.4 ★拓展案例:以弱胜强
  • 10 斗鸡博弈:狭路相逢的策略
    • 10.1 斗鸡博弈模型与分析
    • 10.2 鹬蚌相争的困局
    • 10.3 攻击的仪式化
    • 10.4 把对手变成朋友
    • 10.5 学会见好就收
    • 10.6 斗鸡博弈的应用
    • 10.7 ★拓展案例:庄子提出的“斗鸡最高境界”
  • 11 无处不在的博弈智慧
    • 11.1 回顾
    • 11.2 严格劣势策略消去法
    • 11.3 选举投票与博弈
    • 11.4 脏脸博弈
零和博弈

引入——观察下面的支付矩阵有什么特点?(5分钟)

                           



 

  

 


 

M

 
 

N

 
 

 
 

M

 
 

7, -7)

 
 

5, -5

 
 

N

 
 

(-5, 5

 
 

 (3, -3)

 

分析:每种策略组合下,参与人的收益互为相反数,和为零。

一、零和博弈(20分钟)

(一)零和博弈和非零和在博弈

定义:如果一个博弈在所有各种对局下全体参与人的收益总和全部为零,这个博弈就叫零和博弈;相反,如果一个博弈在所有各种对局下全体参与人的收益总和不全部为零,这个博弈就叫非零和博弈。

零和博弈是利益对抗程度最高的博弈。

判断下列博弈是否为零和博弈? 

例1

                     


 

 
 

坦白

 
 

抵赖

 
 

 
 

坦白

 
 

3 3

 
 

0 5

 
 

抵赖

 
 

5 0

 
 

1 1

 

 

     每种策略组合下,参与人甲乙的收益和均不为零,故不是零和博弈。

 

例2

                                       



 

同学甲

 
 

同学乙

 

 

石头

 
 

剪刀

 
 

 
 

石头

 
 

(0, 0)

 
 

(1, -1)

 
 

(-1, 1)

 
 

剪刀

 
 

(-1, 1)

 
 

(0, 0)

 
 

(1, -1)

 
 

 
 

(1, -1)

 
 

(-1, 1)

 
 

(0, 0)

 

 

每种策略组合下,参与人甲乙的收益和均为零,故该博弈是零和博弈。


(二)常和博弈和非常和博弈

定义:如果一个博弈在所有各种对局下全体参与人的收益总和总是保持为一个常数,这个博弈就叫常和博弈;相反,如果一个博弈在所有各种对局下全体参与人的收益总和不总是保持为一个常数,这个博弈就叫非常和博弈。

常和博弈也是利益对抗程度最高的博弈。

判断下列博弈是否为常和博弈?

                     


 

 
 

U

 
 

L

 
 

 
 

U

 
 

(3,2)

 
 

(1,4)

 
 

L

 
 

(5,0)

 
 

(2, 3)

 

 

每种策略组合下,参与人甲乙的收益和均为5,故该博弈是常和博弈。

(三)常和博弈与零和博弈的关系

常和博弈分为零和博弈和非零和博弈

相关概念:

(1)在一个n人常和博弈中,每种策略组合下,n个参与人的支付总和是一个常数。那么,常数的1/n称为该常和博弈的偏零因子。

(2)从每个参与人的支付中减去博弈的偏零因子,就将该常和博弈转换为零和博弈,此时的零和博弈叫做该常和博弈G的归零博弈。

 

例3   掷硬币博弈

                     


 

 
 

正面

 
 

反面

 
 

 
 

正面

 
 

(-1.5,0.5)

 
 

(0.5,-1.5)

 
 

反面

 
 

(0.5,-1.5)

 
 

(-1.5,0.5)

 

 

经分析,该博弈为常和博弈,常和为-1,偏零因子为-1/2

求解其归零博弈:每个支付值减去-1/2

                     


 

 
 

正面

 
 

反面

 
 

 
 

正面

 
 

(-1,1)

 
 

(1,-1)

 
 

反面

 
 

(,-1)

 
 

(-1,1)

 

 

现将参与人甲、乙的支付矩阵单独列出:

                     


 

 
 

正面

 
 

反面

 
 

 
 

正面

 
 

-1

 
 

1

 
 

反面

 
 

1

 
 

-1

 

参与人甲的支付矩阵

 

                     


 

 
 

正面

 
 

反面

 
 

 
 

正面

 
 

1

 
 

-1

 
 

反面

 
 

-1

 
 

1

 

参与人乙的支付矩阵

在研究二人零和博弈时,只要研究一个人的支付矩阵即可。