博弈论

顾倩倩

目录

  • 1 课程概况
    • 1.1 课程主要内容
    • 1.2 课程目标
    • 1.3 教材及参考书目
    • 1.4 考核方式
  • 2 导论:何为博弈?
    • 2.1 课程导入
    • 2.2 从一个故事说起
    • 2.3 我国古人对博弈的阐释
    • 2.4 理论的诞生与发展
    • 2.5 博弈论的应用领域
    • 2.6 学习博弈论的收益
    • 2.7 小结
  • 3 走进博弈论
    • 3.1 博弈的术语
    • 3.2 博弈的表示方法
    • 3.3 博弈的基本分类
    • 3.4 课前任务
    • 3.5 博弈的基本假设
    • 3.6 共同知识假设
  • 4 纳什均衡
    • 4.1 纳什:天才还是疯子
    • 4.2 解放博弈论
    • 4.3 纳什均衡
    • 4.4 挑战亚当·斯密
    • 4.5 课后任务
  • 5 囚徒困境与完全信息静态博弈
    • 5.1 囚徒困境详解
    • 5.2 囚徒困境与制度建设
    • 5.3 如何走出囚徒困境?
    • 5.4 完全信息静态博弈
  • 6 囚徒困境的扩展应用
    • 6.1 大萧条与凯恩斯革命
    • 6.2 价格战
    • 6.3 独裁者与多数人的懦弱
    • 6.4 民主与多数人的暴政
    • 6.5 公共地悲剧
    • 6.6 旅行者困境
  • 7 智猪博弈与搭便车策略
    • 7.1 智猪博弈案例
    • 7.2 智猪博弈的扩展
    • 7.3 实例分析
    • 7.4 智猪博弈优化
  • 8 懦夫博弈与性别之战
    • 8.1 懦夫博弈
      • 8.1.1 基本模型
      • 8.1.2 实例分析
      • 8.1.3 公共物品的提供
    • 8.2 性别之战
      • 8.2.1 基本模型
      • 8.2.2 实例分析
      • 8.2.3 扩展分析
  • 9 枪手博弈:学会置身事外的智慧
    • 9.1 引入:后汉三国的局势
    • 9.2 枪手博弈
    • 9.3 置身事外的智慧
    • 9.4 进攻方向的选择
  • 10 万元陷阱与沉没成本
    • 10.1 万元陷阱
    • 10.2 沉没成本效应与路径依赖
  • 11 蜈蚣博弈:从终点出发的思维
    • 11.1 课前任务
    • 11.2 蜈蚣博弈及其悖论
    • 11.3 海盗分金案例
    • 11.4 人生的倒后推理
    • 11.5 选择决定人生
  • 12 最后通牒与讨价还价
    • 12.1 最后通牒
      • 12.1.1 最后通牒的含义
      • 12.1.2 独裁者博弈
    • 12.2 讨价还价博弈:把自己变成谈判高手
      • 12.2.1 案例引入
      • 12.2.2 基本模型
      • 12.2.3 讨价还价的博弈智慧
  • 13 酒吧博弈:混沌系统中的策略
    • 13.1 要不要去酒吧?
    • 13.2 非线性系统:一加一并不等于二
    • 13.3 混沌世界的临界点
    • 13.4 分阶段实现人生目标
    • 13.5 让开那座独木桥
  • 14 无处不在的博弈智慧
    • 14.1 选举投票与博弈
    • 14.2 海滩占位模型
纳什均衡

案例:囚徒困境

l甲、乙因私闯民宅被警方抓获,警方怀疑他们有盗窃行为,对其进行隔离审讯。

l 根据“坦白从宽、抗拒从严”的原则:

Ø 如果两人都认罪,则各判 3 年

Ø 如果一人坦白招供,另一人抵赖,则坦白的当即释放,抵赖的判5年Ø 如果两人都拒不认罪,警方因证据不足,只能因私闯民宅判每人1年  

     

博弈过程中,一方会根据另一方的策略来作出决策:

Ø如果对方选择坦白,“我”选择坦白,被判3年;选择抵赖,被判5年。因此,“我”会选择坦白。

Ø如果对方选择抵赖,“我”选择坦白,可当即释放;选择抵赖,被判1年。因此,“我”会选择坦白。

结论:不管对方如何选择,“我”选择“坦白”策略总是最理想的。

结局:最终,博弈结果将稳定双方选择坦白策略,每人被判3年。也就是说,此时博弈双方的策略选择达到一种均衡状态,这种均衡就叫做纳什均衡,记作(坦白,坦白)或(-3,-3)

                     

囚徒困境的支付矩阵


 

 

 

坦白

 

 

抵赖

 

 

 

 

坦白

 

 

-3,-3

 

 

0,-5

 

 

抵赖

 

 

-5,0

 

 

-1,-1

 

通过上图表可以看出“囚徒困境”中包含两个“纳什均衡”:

(坦白,坦白)或(-3,-3)(抵赖,抵赖)或(-1,-1)

第1个是一种坏均衡,第2个是一种好均衡。

故事拓展:

(1)楚魏村民种瓜

古时候,楚国和魏国交界处有一个小县城,城中的居民都以种瓜为生。有一年,天气大旱。

魏国的村民挑水浇瓜,瓜苗长势喜人;而楚国的村民比较懒,所以瓜苗长得又枯又黄。楚国村民看着魏国那边的瓜苗后心生嫉妒,夜里组织人到魏国将瓜苗拔出来扔到一边。魏国的村民知道之后,非常气愤,决定以牙还牙,报复楚国的村民。

但是,村长却反对这样做。他认为报复的结局是两败俱伤,最终两个村到了秋后谁也收获不了瓜。最后村长提出了一个想法,那就是以德报怨,晚上组织村民偷偷到楚国一边的田地里,替他们给瓜苗浇水。村民们按照村长说的去做,最后楚国的村民看到自己田里的瓜苗变绿了,并且知道是魏国的村民晚上来偷偷浇水,都感到非常羞愧。为了表示歉意,楚国村民晚上偷偷到魏国村庄的田地里去替他们重新种上了瓜苗。

最终,双方平安无事,从此和谐相处。

(2)六尺巷传说

纳什均衡

定义:给定其他参与者在博弈均衡时的策略,任何博弈参与者都没有 动机改变自己在博弈均衡时的策略选择。这样的均衡被称为“纳什均衡”。

解释:给定嫌疑人甲在纳什均衡的策略选择坦白,不论嫌疑人乙选择什么策略,嫌疑人甲都没有动机改变自己在纳什均衡的策略。