逆向歸納法
1.什么是逆向歸納法
逆向歸納法(backward induction)是求解動態(tài)博弈均衡的方法。所謂動態(tài)博弈是指博弈參與人的行動存在著先后次序,并且后行動的參與人能夠觀察到前面的行動。逆向歸納法在邏輯上是嚴密的,然而它存在著“困境”。所謂逆向歸納法是從動態(tài)博弈的最后一步往回推,以求解動態(tài)博弈的均衡結果。逆向歸納法又稱逆推法。它是完全歸納推理,其推理是演繹的,即結論是必然的。[1]
在完全且完美的動態(tài)博弈中,先行為的理性博弈人,在前面階段選擇策略時,必然會考慮后行博弈人在后面階段中將會怎樣選擇策略。因而,只有在博弈的最后一個階段,不再有后續(xù)階段牽制的情況下,博弈人才能作出明智的選擇。在后面階段博弈人選擇的策略確定后,前一階段的博弈人在選擇策略時也就相對容易。
逆向歸納法就是從動態(tài)博弈的最后一個階段開始分析,逐步向前歸納出各階段博弈人的選擇策略。
逆向歸納法的邏輯基礎:動態(tài)博弈中先行動的參與人,在前面階段選擇行為時必然會考慮后行動的參與人在后面階段中的行為選擇,只有在最后一階段的參與人才能不受其他參與人的制約而直接做出選擇。而當后面階段的參與人的選擇確定后,前一階段的參與人的行為也就容易確定了。逆向歸納法排除了不可信的威脅或承諾。
2.逆向歸納法的運用
逆向歸納法:它的精髓就是“向前展望,向后推理”,即首先仔細思考自己的決策可能引起的所有后續(xù)反應,以及后續(xù)反應的后續(xù)反應,直至博弈結束;然后從最后一步開始,逐步倒推,以此找出自己在每一步的最優(yōu)選擇。[1]
圖1的求解過程如下:
- (a)若2在右,2將選擇進(0.3);∵(0.3)>(0.0)
- (b)若2在左,2將選擇退(3.0);∵(3.0)>(-1.-1)
- (c)在2的選擇中1的最大收益是選擇進;∵(3.0)>(0.3)
- ∴納什均衡為(進(進,退))均衡解為(進,退),均衡收益為(3.0)
(2)逆向歸納法僅適合有限步動態(tài)博弈,而且要求決策者犯的可能性很小。
如果使用逆向歸納法得到的結果是A選擇右邊的行動,雙方各得3。
如果A在第一步選擇下邊的行動,B該做何想?只有當A在第二步犯錯誤的可能性小于1/11時,B才有膽量選擇讓游戲繼續(xù)玩下去。于是A極有可能獲得10這個最大回報。