正則形式的博弈

在博弈論中，正則形式（Normal-form game）是描述博弈的一種方式。與延展形式不同，正則形式不用圖形來描述博弈，而是用矩陣來陳述博弈。與延展形式的表述方式相比，這種方式在識別出嚴格優勢策略和納殊均衡上更有用，但會丟失某些資訊。博弈的正則形式的表述方式包括如下部分：每個參與者所有顯然的和可能的策略，以及和與其相對應的收益。

在非完美資訊的完全靜態博弈中，正則形式的表述方式詳細地說明了參與者策略空間和收益函數。策略空間是某個參與者的所有可能策略的集合。策略是參與者在博弈的每個階段——不管在博弈中這個階段實際上是否會出現——將要採取的行動的完整計劃。每個參與者的收益函數，是從參與者策略空間的向量積到該參與者收益集合（一般是實數集，數字表示基數效用或序數效用——在正則形式的表述方式中常常是基數效用）的映射。也就是說，參與者的收益函數把策略組合（所有參與者策略的清單）作為它的輸入量，然後輸出參與者的收益。

一個實例

*一個正則形式的博弈*
	乙選擇左	乙選擇右
甲選擇頂	4, 3	-1, -1
甲選擇底	0, 0	3, 4

有種博弈是參與者同時（或至少在做出行動前不觀察其他參與者的動作）做出行動，並按照上述已做出行動的組合獲得收益。右邊的矩陣是這種博弈得正則形式的表述方式。例如，如果甲做出行動「頂」，而乙做出行動「左」，則甲得到收收益4，乙得到收益3。在每個回合，第一個數字代表排參與者（此處為甲）的收益，第二個數字代表列參與者（此處為乙）的收益。

其他表述方式

對稱博弈（其收益不是依賴於參與者選擇的動作）常常被表述為只有一種收益，即豎排參與者的收益。例如，左右兩邊的收益矩陣表述的是同一個博弈。

*兩個參與者都有的*
	雄鹿	野兔
雄鹿	3, 3	0, 2
野兔	2, 0	2, 2

*只有豎排的*
	雄鹿	野兔
雄鹿	3	0
野兔	2	2

正則形式的使用

佔優策略

*囚徒困境*
	合作	背叛
合作	2, 2	0, 3
背叛	3, 0	1, 1

收益矩陣有助於剔除劣勢策略，而且經常被用於說明這個概念。例如，在囚徒困境中（右圖），參與者會發現因為其他人的背叛，合作成了嚴格劣勢策略。參與者會比較每列的第一個數字，在這個例子中，3>2且1>0。這表明無論橫排參與者怎樣選擇，豎排參與者選擇背叛都比較好些。類似地，參與者會比較每列的第二個數字，同樣也是3>2且1>0。這說明無論豎排參與者怎麼做，橫排參與者選擇背叛都比較好些。這就證明了此博弈唯一的納殊均衡是（背叛，背叛）。

正則形式的連續博弈

*一個連續博弈*
	左，左	左，右	右，左	右，右
頂	4, 3	4, 3	-1, -1	-1, -1
底	0, 0	3, 4	0, 0	3, 4

這些矩陣只表述同時（或者更一般地，資訊是不完美的）做出行動的博弈。上述矩陣不能表述甲先做出行動，被乙觀察到，然後乙再做出行動的博弈。因為在這個例子中，無法確定乙每次的策略。為了表述這種連續博弈，我們要列出乙在博弈進行期間所有的行動——儘管根據實際情況，某種行動決不會出現。和前面一樣，在這個博弈中乙有兩種選擇，左和右。與前面不一樣的是，視甲的行動不同而定，乙有四種策略。這些策略是：

如果甲選擇頂，選擇左；否則，選擇左
如果甲選擇頂，選擇左；否則，選擇右
如果甲選擇頂，選擇右；否則，選擇左
如果甲選擇頂，選擇右；否則，選擇右

右圖是這個博弈的正則形式的表述方式。

一般形式

為了用把博弈表述成正則形式，需要提供下列數據：

表示參與者的有限集P，標記為{1,2,…,m}
每個參與者k在P里擁有有限個純策略

$S_{k}=\{1,2,\ldots ,n_{k}\}.$

一個純策略組合是參與者策略的聯合，這是一個m元組

${\vec {\sigma }}=(\sigma _{1},\sigma _{2},\ldots ,\sigma _{m})$

則有

$\sigma _{1}\in S_{1},\sigma _{2}\in S_{2},\ldots ,\sigma _{m}\in S_{m}$

我們用Σ來表示策略組合的集合

收益函數形如

$F:\Sigma \rightarrow \mathbb {R} .$

其預期解釋是博弈結束時給予單個參與者的獎品。相應地，為了完整地說明一個博弈，收益函數必須在參與者集 P= {1, 2, ..., m}中對每個參與者詳細說明。

定義：一個正則形式的博弈的結構形如

$(P,\mathbf {S} ,\mathbf {F} )$

這裏 P = {1,2, ...,m}是參與者集合，

$\mathbf {S} =(S_{1},S_{2},\ldots ,S_{m})$

是純策略集合的一個m元組，每個純策略對應於一個參與者，而

$\mathbf {F} =(F_{1},F_{2},\ldots ,F_{m})$

是收益函數的m元組。

沒有理由在前面的討論中，把參與者數量有限或每個參與者的策略有限的博弈排除在外。因為要用到泛函分析的技巧，關於有限博弈的研究非常艱深。

參考文獻

D. Fudenberg and J. Tirole, Game Theory, MIT Press, 1991.
R. D. Luce and H. Raiffa, Games and Decisions, Dover Publications, 1989.
J. Weibull, Evolutionary Game Theory, MIT Press, 1996
J. von Neumann and O. Morgenstern, Theory of games and Economic Behavior, John Wiley Science Editions, 1964. This book was initially published by Princeton University Press in 1944.

外部連結

http://www.whalens.org/Sofia/choice/matrix.htm （頁面存檔備份，存於互聯網檔案館）

閱論編博弈論專題
定義	正則形式的博弈 · 擴展形式的博弈 · 圖博弈論 · 合作博弈 · 資訊集合 · 偏好
均衡概念（英語：Solution concept）	納殊均衡 · 強納殊均衡（英語：Strong Nash equilibrium） · 子博弈均衡（英語：Subgame perfect equilibrium） · 貝葉斯-納殊均衡 · 貝葉斯完美均衡（英語：Perfect Bayesian equilibrium） · 顫抖手完美均衡 · 恰當均衡（英語：Proper equilibrium） · ε-均衡 · 相關均衡 · 序貫均衡 · 准完美均衡（英語：Quasi-perfect equilibrium） · 進化穩定策略（英語：Evolutionarily stable strategy） · 風險佔優（英語：Risk dominance） · 柏拉圖最適 · 自我應驗均衡（英語：Self-confirming equilibrium） · 馬爾可夫完美均衡（英語：Markov perfect equilibrium） · 默滕斯穩定均衡（英語：Mertens-stable equilibrium） · 核（英語：Core (game theory)） · 夏普利值（英語：Shapley value） · 吉布斯均衡（英語：Potentialg ame） · 量子響應均衡（英語：Quantal response equilibrium） · 謝林點
策略	優勢策略 · 純策略 · 混合策略 · 以牙還牙 · 冷酷觸發策略（英語：Grim trigger） · 策略複製論證（英語：Strategy-stealing argument） · 逆向歸納法（英語：Backward induction） · 前向歸納法（英語：Forward induction） · 馬爾可夫策略（英語：Markov strategy）
博弈類型	對稱博弈 · 完美資訊 · 序列博弈 · 重複博弈 · 信號博弈 · 廉價磋商（英語：Cheap talk） · 零和博弈 · 機制設計 · 隨機博弈 · 非傳遞博弈 · 全局博弈（英語：Global game） · 甄別博弈（英語：screening game） · 討價還價問題（英語：Bargaining problem） · 多人博弈（英語：n-player game） · 大型泊松博弈（英語：Large Poisson game） · 嚴格決定博弈 · 潛博弈（英語：Potential game） · 位勢博弈
博弈模型	圍棋 · 國際象棋 · 無限棋（英語：Infinite chess） · 西洋跳棋 · 井字棋 · 囚徒困境（可選擇的囚徒博弈（英語：Optional prisoner's dilemma） · 用餐者困境） · 旅行者困境 · 猜均值的2/3 · 協調博弈（英語：Coordination game） · 蜈蚣博弈 · 志願者困境 · 搭便車問題 · 拍賣美元 · 膽小鬼博弈 · 智豬博弈 · 性別戰 · 獵鹿博弈 · 賭便士（英語：Matching pennies） · 最後通牒博弈（海盜博弈） · 包、剪、揼 · 獨裁者博弈（信任遊戲） · 公共財博弈（英語：Public goods game） · 納殊討價還價問題（英語：Nash Bargaining Game） · 上校博弈 · 消耗戰 · 少數派博弈（El Farol酒吧問題） · 公平分配博弈（切蛋糕問題（英語：Fair cake-cutting）） · 古諾競爭 · 死結 · 庫恩撲克遊戲（英語：Kuhn poker） · 甄別博弈（英語：Screening Game） · 公主與怪獸遊戲（英語：Princess and monster game） · 約會問題（英語：Rendezvous problem） · 囚徒帽子謎題（英語：Prisoners and hats puzzle）
定理	極值定理 · 純化定理（英語：Purification theorem） · 無名氏定理 · 顯示定理（英語：Revelation principle） · 阿羅不可能定理 · 極小化極大算法 · 納殊均衡 · 策梅洛定理
關鍵人物（英語：List of game theorists）	阿爾伯特·W·塔克 · 阿摩司·特沃斯基 · 阿里埃勒·魯賓斯坦 · 克勞德·香農 · 丹尼爾·卡內曼 · 戴維·K·萊文（英語：David K. Levine） · 戴維·M·克雷普斯（英語：David M. Kreps） · 唐納德·B·吉利斯（英語：Donald B. Gillies） · 朱·弗登博格（英語：Drew Fudenberg） · 埃里克·馬斯金 · 哈羅德·W·庫恩（英語：Harold W. Kuhn） · 赫伯特·亞歷山大·西蒙（司馬賀） · 埃爾維·穆蘭（英語：Hervé Moulin） · 讓·梯若爾 · 讓-弗朗索瓦·默滕斯（英語：Jean-François Mertens） · 珍妮弗·圖爾·蔡司（英語：Jennifer Tour Chayes） · 夏仙義·亞諾什·卡羅伊 · 約翰·梅納德·史密斯 · 安托萬·奧古斯丁·庫爾諾 · 約翰·福布斯·納殊 · 約翰·馮·諾伊曼 · 肯尼斯·阿羅 · 肯尼思·賓默爾 · 里奧尼德·赫維克茲 · 勞埃德·沙普利 · 梅爾文·德雷希爾（英語：Melvin Dresher） · 梅里爾·M·弗勒德 · 奧嘉·邦達雷娃（英語：Olga Bondareva） · 奧斯卡·莫根施特恩（英語：Oskar Morgenstern） · 保羅·米爾格龍 · 佩頓·楊（英語：Peyton Young） · 賴因哈德·澤爾騰 · 羅伯特·阿克塞爾羅 · 羅伯特·約翰·奧曼 · 羅伯特·B·威爾遜 · 羅傑·梅爾森 · 塞繆爾·鮑爾斯（英語：Samuel Bowles (economist)） · 蘇珊娜·斯科奇姆 · 托馬斯·克羅姆比·謝林 · 威廉·維克里
參見	全支付拍賣 · Alpha-beta剪枝 · 伯川德悖論（英語：Bertrand paradox (economics)） · 有限理性 · 組合博弈論 · 對抗分析（英語：Confrontation analysis） · 合作性競爭 · 棋局中的先手優勢（英語：First-move advantage in chess） · 博弈機制（英語：Game mechanics） · 博弈論詞彙表（英語：Glossary of game theory） · 博弈理論家列表（英語：List of game theorists） · 特殊博弈列表 · 雙輸 · 國際象棋的解局策略（英語：Solving chess） · 拓撲博弈（英語：Topological game） · 公地悲劇 · 小決定暴政