純策略納什均衡
1.什么是純策略納什均衡
純策略納什均衡是指在一個(gè)純策略組合中,如果給定其他的策略不變,該節(jié)點(diǎn)不會(huì)單方面改變自己的策略,否則不會(huì)使節(jié)點(diǎn)訪(fǎng)問(wèn)代價(jià)變小。
2.存在純策略納什均衡的有限次重復(fù)博弈[1]
如果重復(fù)博弈中有惟一純策略納什均衡,那么我們?cè)趺凑页鏊募儾呗约{什均衡呢?首先看下面囚徒的困境的博弈的例子:
我們現(xiàn)在考慮該博弈重復(fù)兩次的重復(fù)博弈,這可以理解成給囚徒兩次坦白機(jī)會(huì),最后的得益是兩個(gè)階段博弈中各自得益之和.在兩次博弈過(guò)程中,雙方知道第一次博弈的結(jié)果再進(jìn)行二次博弈.用逆推歸納法來(lái)分析,先分析第二階段,也就是第二次重復(fù)時(shí)兩博弈方的選擇.很明顯,這個(gè)第二階段仍然是兩囚徒之間的一個(gè)囚徒的困境博弈,此時(shí)前一階段的結(jié)果已成為既成事實(shí),此后又不再有任何的后續(xù)階段,因此實(shí)現(xiàn)自身當(dāng)前的最大利益是兩博弈方在該階段決策中的惟一原則.
因此我們不難得出結(jié)論,不管前一次的博弈得到的結(jié)果如何,第二階段的惟一結(jié)果就是原博弈惟一的納什均衡(坦白,坦白),雙方得益(-5,-5).
現(xiàn)在再回到第一階段,即第一次博弈.理性的博弈方在第一階段就對(duì)后一階段的結(jié)局非常清楚,知道第二階段的結(jié)果必然是(坦白,坦白),因此不管第一階段的博弈結(jié)果是什么,雙方在整個(gè)重復(fù)博弈中的最終得益,都將是第一階段的基礎(chǔ)上各加-5.因此從第一階段的選擇來(lái)看,這個(gè)重復(fù)博弈與圖l中得益矩陣表示的一次性博弈實(shí)際上是完全等價(jià)的.
于是我們可以得出惟一純策略均衡的有限次重復(fù)博弈的結(jié)果就是重復(fù)原博弈惟一的純策略納什均衡,這就是這種重復(fù)博弈惟一的子博弈完美納什均衡路徑.
如果重復(fù)博弈中有多個(gè)純策略納什均衡,設(shè)某一市場(chǎng)有兩個(gè)生產(chǎn)同樣質(zhì)量產(chǎn)品的廠商,他們對(duì)產(chǎn)品的定價(jià)同有高(H)、中(M)、低(L)三種可能.設(shè)高價(jià)時(shí)市場(chǎng)總利潤(rùn)為10個(gè)單位,中價(jià)時(shí)市場(chǎng)總利潤(rùn)為6個(gè)單位,低價(jià)時(shí)市場(chǎng)總利潤(rùn)為2個(gè)單位.再假設(shè)兩廠商同時(shí)決定價(jià)格,價(jià)格不等時(shí)低價(jià)格者獨(dú)享利潤(rùn),價(jià)格相等時(shí)雙方平分利潤(rùn).這時(shí)候兩廠商對(duì)價(jià)格的選擇就構(gòu)成了一個(gè)靜態(tài)博弈問(wèn)題.我們看一個(gè)三價(jià)博弈的重復(fù)博弈的例子:
顯然,這個(gè)得益矩陣有兩個(gè)純策略納什均衡(M,M)和(L,L),我們也可以看出實(shí)際上兩博弈方最大的得益是策略組合(H,H),但是它并不是納什均衡.現(xiàn)在考慮重復(fù)兩次該博弈,我們采用一種觸發(fā)策略(Trigger Strategy):博弈雙方首先試圖合作,一旦發(fā)覺(jué)對(duì)方不合作也用不合作相報(bào)復(fù)的策略.使得在第一階段采用(H,H)成為子博弈完美納什均衡,其雙方的策略是這樣的:
博弈方1:第一次選H;如果第一次結(jié)果為(H,H),則第二次選M,如果第一次結(jié)果為任何其他策略組合,則第二次選擇L.
博弈方2:同博弈方1.在上述雙方策略組合下,兩次重復(fù)博弈的路徑一定為第一階段(H,H),第二階段(M,M),這是一個(gè)子博弈完美納什均衡路徑.因?yàn)榈诙A段是一個(gè)原博弈的納什均衡,因此不可能有哪一方愿意單獨(dú)偏離;其次,第一階段的(H,H)雖然不是原來(lái)的博弈納什均衡,但是如果一方單獨(dú)偏離,采用M能增加1單位得益,這樣的后果卻是第二階段至少要損失2單位的得益,因?yàn)殡p方采用的是觸發(fā)策略,即有報(bào)復(fù)機(jī)制的策略,因此合理的選擇是堅(jiān)持H.這就說(shuō)明了上述策略組合是這個(gè)兩次重復(fù)博弈的子博弈完美納什均衡.
從上述的例子我們可以看出,有多個(gè)純策略納什均衡的博弈重復(fù)兩次的子博弈完美納什均衡路徑是,第一階段采用(H,H),第二階段采用原博弈的納什均衡(M,M).
如果這個(gè)重復(fù)博弈重復(fù)三次,或者更多次,結(jié)論也是相似的,仍然用觸發(fā)策略,它的子博弈完美納什均衡路徑為除了最后一次以外,每次都采用(H,H),最后一次采用原博弈的納什均衡(M,M).