逆向歸納法
1.什么是逆向歸納法
逆向歸納法(backward induction)是求解動(dòng)態(tài)博弈均衡的方法。所謂動(dòng)態(tài)博弈是指博弈參與人的行動(dòng)存在著先后次序,并且后行動(dòng)的參與人能夠觀察到前面的行動(dòng)。逆向歸納法在邏輯上是嚴(yán)密的,然而它存在著“困境”。所謂逆向歸納法是從動(dòng)態(tài)博弈的最后一步往回推,以求解動(dòng)態(tài)博弈的均衡結(jié)果。逆向歸納法又稱逆推法。它是完全歸納推理,其推理是演繹的,即結(jié)論是必然的。[1]
在完全且完美的動(dòng)態(tài)博弈中,先行為的理性博弈人,在前面階段選擇策略時(shí),必然會(huì)考慮后行博弈人在后面階段中將會(huì)怎樣選擇策略。因而,只有在博弈的最后一個(gè)階段,不再有后續(xù)階段牽制的情況下,博弈人才能作出明智的選擇。在后面階段博弈人選擇的策略確定后,前一階段的博弈人在選擇策略時(shí)也就相對(duì)容易。
逆向歸納法就是從動(dòng)態(tài)博弈的最后一個(gè)階段開始分析,逐步向前歸納出各階段博弈人的選擇策略。
逆向歸納法的邏輯基礎(chǔ):動(dòng)態(tài)博弈中先行動(dòng)的參與人,在前面階段選擇行為時(shí)必然會(huì)考慮后行動(dòng)的參與人在后面階段中的行為選擇,只有在最后一階段的參與人才能不受其他參與人的制約而直接做出選擇。而當(dāng)后面階段的參與人的選擇確定后,前一階段的參與人的行為也就容易確定了。逆向歸納法排除了不可信的威脅或承諾。
2.逆向歸納法的運(yùn)用
逆向歸納法:它的精髓就是“向前展望,向后推理”,即首先仔細(xì)思考自己的決策可能引起的所有后續(xù)反應(yīng),以及后續(xù)反應(yīng)的后續(xù)反應(yīng),直至博弈結(jié)束;然后從最后一步開始,逐步倒推,以此找出自己在每一步的最優(yōu)選擇。[1]
圖1的求解過程如下:
- (a)若2在右,2將選擇進(jìn)(0.3);∵(0.3)>(0.0)
- (b)若2在左,2將選擇退(3.0);∵(3.0)>(-1.-1)
- (c)在2的選擇中1的最大收益是選擇進(jìn);∵(3.0)>(0.3)
- ∴納什均衡為(進(jìn)(進(jìn),退))均衡解為(進(jìn),退),均衡收益為(3.0)
(2)逆向歸納法僅適合有限步動(dòng)態(tài)博弈,而且要求決策者犯的可能性很小。
如果使用逆向歸納法得到的結(jié)果是A選擇右邊的行動(dòng),雙方各得3。
如果A在第一步選擇下邊的行動(dòng),B該做何想?只有當(dāng)A在第二步犯錯(cuò)誤的可能性小于1/11時(shí),B才有膽量選擇讓游戲繼續(xù)玩下去。于是A極有可能獲得10這個(gè)最大回報(bào)。