首页 > 技术文章 > 04完美信息动态博弈

hdawen 2019-01-11 15:37 原文

本文是根据 Game Theory (Giacomo Bonanno) 一书第二、三、四章整理的学习笔记。

完美信息动态博弈和不完美信息动态博弈

正规形式的博弈概念一般用于静态博弈,静态博弈的过程可以用矩阵表示出来;扩展形式的博弈一般是指动态博弈,动态博弈的过程可以用决策树表示出来。如下图所示是一个用决策树表示的完全且完美信息的动态博弈:

图1

如下图所示是一个用决策树表示的完全且不完美信息的动态博弈:

图2

图1和图2所示的两个博弈过程均只有两个玩家:Player 1 和 Player 2。其中 {A, B} 为 Player 1 的决策集合,图1中 Player 2 的决策集合为{c, d, e ,f},图2中 Player 2 的决策集合为{c, d} 。(1,2) 表示 Player 1、Player 2 分别选取策略 A, c 时的收益,其中 Player 1 的收益为1,Player 2 的收益为2。

信息集合:玩家 i 的信息集是指在博弈中,玩家 i 无法知道它的前驱节点的具体行动(不完美信息),满足这样条件的所有玩家 i 在决策树中的集合称为信息集合。

上图中第二个博弈中的虚线框表示信息集合,也即 Player 1 的决策信息对于 Player 2 来说是不确定的,因此 Player 2 构成一个信息集合。由于 Player 2 不能确定自己在决策树的左分支还是右分支,所以信息集合里面的所有节点所作的下一步决策是完全相同的,因为如果这些节点的下一步决策不同,那就表示该节点知道自己在决策树的位置,而这和不完美信息的条件相矛盾。

对于一个完全且不完美信息博弈,它的决策树需要满足以下条件:

  1. 每个节点都是初始节点的继承者。
  2. 除了初始节点外,每个节点都有一个直接的前任节点。
  3. 从同一个节点扩展的多个分支之间,一定是采取了不同的策略,否则就要合并在一起。
  4. 每个信息集合只包含一个玩家的决策节点。
  5. 信息集合中的节点的后继节点所代表的策略集合必须一样。(如图2所示,Player 1 的两个后继节点在一个信息集合,这些点都是代表 Player 2,而且这些点必须具有相同的策略集合{c,d},图1所带表的完全且完美信息博弈则不需要满足条件4和5)

子博弈精炼纳什均衡

动态博弈的解称为子博弈精炼纳什均衡。逆向归纳法 (Backward induction) 是求解子博弈精炼纳什均衡的经典方法,不过这种方法只适用于有限完全信息的动态博弈。

完全且完美信息动态博弈

图3

如上图所示,1、2、3、4、5是原博弈问题唯一的五个子博弈。

完全且不完美信息动态博弈

图3

如上图所示,2、3、4是原博弈问题唯一的三个子博弈,1因为破坏了信息集合,所以它不是子博弈。

推荐一个比较好的学习网站:\(\color{red}{\rm EconS~424,~Strategy~and~Game~Theory}\) (by Felix Munoz-Garcia)

推荐阅读