扩展形式的博弈

博弈论中，与正则形式相应，扩展形式（英语：Extensive-form game）通过树来描述博弈。每个节点（称作决策节点）表示博弈进行中的每一个可能的状态。博弈从唯一的初始节点开始，通过由参与者决定的路径到达终端节点，此时博弈结束，参与者得到相应的收益。每个非终端节点只属于一个参与者；参与者在该节点选择其可能的行动，每个可能的行动通过边从该节点到达另一个节点。

和正则形式不同，扩展形式允许互动的显式模型（explicit modeling of interactions），互动中，一个参与者可以在博弈中多次行动，并且在不同的状态中可以做出不同的行为。

表述

完整的扩展形式表述包括：

博弈中的参与者
每个参与者能行动的所有机会。
每个参与者在行动时的选择
每个参与者在行动时所知道的情况
每个参与者通过各种可能的行动之后的收益。

右图是一个双人博弈：1和2。每个非终端节点上的数字表示该节点所属的参与者。终端节点上的数字表示参与者的收益（例如:2,1表示参与者1得到2，参与者2得到1）。图片里每个边上的符号是这个边所代表的行动的名字。

初始节点属于参与者1，表示该参与者先动。博弈顺序如下：参与者1选择U或者D；参与者2观察到参与者1的选择，然后选择U' 或者D' ，最后得到最终收益。四个终端节点代表四个结果：(U,U')，(U,D')，(D,U')和(D,D')。每个结果得到的收益分别是(0,0)，(2,1)，(1,2)和(3,1)。

如果参与者1选择D，参与者2为了最大化收益，会选择U'，最后参与者1只能得到1。但是如果参与者1选择U，参与者2为了最大化收益，会选择D' ，此时参与者1得到2。所以参与者1会选择U，参与者2选择D' 。即是子博弈完美均衡。

无限行动空间

参与者在一个特定的决策节点上可能有无数种可能的行动可以选择。其表示方法是用弧形来连接从该决策节点延伸出的两条边。如果行动空间是在两个数字之间的闭联集（continuum），那么把这两个表示上下界限的数字分别放在弧的上方和下方，并用一个变量来表示其支付。此时无数个决策节点可以用一个在弧中心的节点所代替。这种表示方式同样可以用在一个有限的行动空间中，只要该行动空间足够大，此时不可能用边来表示每个行动。

左侧的树表示这样一个博弈：该博弈或者有一个无限行动空间（任何0到5000的实数），或者有一个很大的行动空间（可能是任何在0到5000的整数）。如果我们在这里假设它表示两个参与Stackelberg竞争的企业。公司的支付表示在左边，其中q1和q2表示先行者公司以及追随者公司分别采用的策略，c1和c2是常数（表示公司的机会成本）。该博弈的子博弈完美纳什均衡可以通过对支付函数求追随者策略变量(q2)的一阶偏导数表示其利润最大化，并求出其最优反应函数， $q2(q1)=(5000-q1-c2)/2$ 。用同样的方法计算先行者的最优反应函数，并假定先行者知道追随者会选择上述的行动，通过一阶偏导数来解出 $q1*=(5000+c2-2c1)/2$ 。在将q1*代入到追随者的最优反应函数中， $q2*=(5000+2c1-3c2)/4$ ，此时(q1*,q2*)就是子博弈完美纳什均衡。如果假设 c1=c2=1000，那么子博弈完美纳什均衡的解就是(2000,1000)。

不完美信息

树图清楚地表示了参与者1先动，参与者2观察到参与者1的行动。然而，一些博弈并不是这样。参与者并不是一直能观察到另一个人的选择（例如，同时行动或者行动被隐藏）。信息集是决策节点的组合：

每个节点都属于一个参与者。
参与者无法区分信息集里的多个节点。也就是说：如果信息集有多个节点，信息集所属的参与者就不知道能往哪个节点移动。

完美信息的博弈是指在博弈的任何阶段，每个参与者都清楚博弈之前发生的所有行动，也即每个信息集都是一个单元素集合。没有完美信息的博弈具有不完美信息。

左图中的博弈中，参与者2行动时不知道参与者1的选择，除此之外和第一个博弈相同。第一个博弈具有完美信息；而左图中的没有。如果两个参与者都是理性的，并且都知道对方也是理性人，对方知道的信息，自己也能获得（即参与者1知道参与者2知道参与者1是理性的，参与者2同样也知道，如此循环下去），

公理的公式化

博弈论是一种数学理论，所以上述的博弈树结构可以转化为公式表达。

扩展形式的有限树是这样一个结构 $\Gamma =\langle {\mathcal {K}},\mathbf {H} ,[(\mathbf {H} _{i})_{i\in {\mathcal {I}}}],\{A(H)\}_{H\in \mathbf {H} }],a,\rho ,u\rangle$ 其中：

${\mathcal {K}}=\langle V,v^{0},T,p\rangle$ 表示一个有限的树。 $V$ 是树的所有节点， $v^{0}\in V$ 表示唯一的初始节点， $T\subset V$ 表示所有的终端节点（ $D=V\setminus T$ 是决策节点）以及函数 $p:V\rightarrow D$ 表示博弈的规则，
$\mathbf {H}$ 表示 $D$ 里包含的信息，
$A(H)$ 是信息集 $H\in \mathbf {H}$ 所允许的可能的行动。所有的行动表示为 ${\mathcal {A}}$ 。

参考文献

Dresher M. (1961). The mathematics of games of strategy: theory and applications (Ch4: Games in extensive form, pp74--78). Rand Corp. ISBN 0-486-64216-X
Fudenberg D and Tirole J. (1991) Game theory (Ch3 Extensive form games, pp67-106). Mit press. ISBN 0-262-06141-4
Luce R.D. and Raiffa H. (1957). Games and decisions: introduction and critical survey. (Ch3: Extensive and Normal Forms, pp39-55). Wiley New York. ISBN 0-486-65943-7
Osborne MJ and Rubenstein A. 1994. A course in game theory (Ch6 Extensive game with perfect information, pp. 89-115). MIT press. ISBN 0-262-65040-1

参见

查论编博弈论专题
定义	正则形式的博弈 · 扩展形式的博弈 · 图博弈论 · 合作博弈 · 信息集 · 偏好
均衡概念（英语：Solution concept）	纳什均衡 · 强纳什均衡（英语：Strong Nash equilibrium） · 子博弈均衡（英语：Subgame perfect equilibrium） · 贝叶斯-纳什均衡 · 贝叶斯完美均衡（英语：Perfect Bayesian equilibrium） · 颤抖手完美均衡 · 恰当均衡（英语：Proper equilibrium） · ε-均衡 · 相关均衡 · 序贯均衡 · 准完美均衡（英语：Quasi-perfect equilibrium） · 进化稳定策略（英语：Evolutionarily stable strategy） · 风险占优（英语：Risk dominance） · 帕累托最优 · 自我应验均衡（英语：Self-confirming equilibrium） · 马尔可夫完美均衡（英语：Markov perfect equilibrium） · 默滕斯稳定均衡（英语：Mertens-stable equilibrium） · 核（英语：Core (game theory)） · 夏普利值（英语：Shapley value） · 吉布斯均衡（英语：Potentialg ame） · 量子响应均衡（英语：Quantal response equilibrium） · 谢林点
策略	优势策略 · 纯策略 · 混合策略 · 以牙还牙 · 冷酷触发策略（英语：Grim trigger） · 策略复制论证（英语：Strategy-stealing argument） · 逆向归纳法（英语：Backward induction） · 前向归纳法（英语：Forward induction） · 马尔可夫策略（英语：Markov strategy）
博弈类型	对称博弈 · 完美信息 · 序贯博弈 · 重复博弈 · 信号博弈 · 廉价磋商（英语：Cheap talk） · 零和博弈 · 机制设计 · 随机博弈 · 非传递博弈 · 全局博弈（英语：Global game） · 甄别博弈（英语：screening game） · 讨价还价问题（英语：Bargaining problem） · 多人博弈（英语：n-player game） · 大型泊松博弈（英语：Large Poisson game） · 严格决定博弈 · 潜博弈（英语：Potential game） · 位势赛局
博弈模型	围棋 · 国际象棋 · 无限棋（英语：Infinite chess） · 西洋跳棋 · 井字棋 · 囚徒困境（可选择的囚徒博弈（英语：Optional prisoner's dilemma） · 用餐者困境） · 旅行者困境 · 猜均值的2/3 · 协调博弈（英语：Coordination game） · 蜈蚣博弈 · 志愿者困境 · 搭便车问题 · 拍卖美元 · 胆小鬼博弈 · 智猪博弈 · 性别战 · 猎鹿赛局 · 赌便士（英语：Matching pennies） · 最后通牒赛局（海盗博弈） · 石头、剪子、布 · 独裁者赛局（信任游戏） · 公共财赛局（英语：Public goods game） · 纳什讨价还价问题（英语：Nash Bargaining Game） · 上校赛局 · 消耗战 · 少数派博弈（El Farol酒吧问题） · 公平分配博弈（切蛋糕问题（英语：Fair cake-cutting）） · 古诺竞争 · 死结 · 库恩扑克游戏（英语：Kuhn poker） · 甄别博弈（英语：Screening Game） · 公主与怪兽游戏（英语：Princess and monster game） · 约会问题（英语：Rendezvous problem） · 囚徒帽子谜题（英语：Prisoners and hats puzzle）
定理	极值定理 · 纯化定理（英语：Purification theorem） · 无名氏定理 · 显示定理（英语：Revelation principle） · 阿罗不可能定理 · 极小化极大算法 · 纳什均衡 · 策梅洛定理
关键人物（英语：List of game theorists）	阿尔伯特·W·塔克 · 阿摩司·特沃斯基 · 阿里埃勒·鲁宾斯坦 · 克劳德·香农 · 丹尼尔·卡内曼 · 戴维·K·莱文（英语：David K. Levine） · 戴维·M·克雷普斯（英语：David M. Kreps） · 唐纳德·B·吉利斯（英语：Donald B. Gillies） · 朱·弗登博格（英语：Drew Fudenberg） · 埃里克·马斯金 · 哈罗德·W·库恩（英语：Harold W. Kuhn） · 赫伯特·亚历山大·西蒙（司马贺） · 埃尔维·穆兰（英语：Hervé Moulin） · 让·梯若尔 · 让-弗朗索瓦·默滕斯（英语：Jean-François Mertens） · 珍妮弗·图尔·蔡司（英语：Jennifer Tour Chayes） · 夏仙义·亚诺什·卡罗伊 · 约翰·梅纳德·史密斯 · 安托万·奥古斯丁·库尔诺 · 约翰·福布斯·纳什 · 约翰·冯·诺伊曼 · 肯尼斯·阿罗 · 肯尼思·宾默尔 · 里奥尼德·赫维克兹 · 劳埃德·沙普利 · 梅尔文·德雷希尔（英语：Melvin Dresher） · 梅里尔·M·弗勒德 · 奥嘉·邦达雷娃（英语：Olga Bondareva） · 奥斯卡·莫根施特恩（英语：Oskar Morgenstern） · 保罗·米尔格龙 · 佩顿·杨（英语：Peyton Young） · 赖因哈德·泽尔腾 · 罗伯特·阿克塞尔罗 · 罗伯特·约翰·奥曼 · 罗伯特·B·威尔逊 · 罗杰·梅尔森 · 塞缪尔·鲍尔斯（英语：Samuel Bowles (economist)） · 苏珊娜·斯科奇姆 · 托马斯·克罗姆比·谢林 · 威廉·维克里
参见	全支付拍卖 · Alpha-beta剪枝 · 伯川德悖论（英语：Bertrand paradox (economics)） · 有限理性 · 组合博弈论 · 对抗分析（英语：Confrontation analysis） · 合作性竞争 · 棋局中的先手优势（英语：First-move advantage in chess） · 博弈机制（英语：Game mechanics） · 博弈论词汇表（英语：Glossary of game theory） · 博弈理论家列表（英语：List of game theorists） · 特殊博弈列表 · 双输 · 国际象棋的解局策略（英语：Solving chess） · 拓扑博弈（英语：Topological game） · 公地悲剧 · 小决定暴政