純策略納什均衡

1.什么是純策略納什均衡

純策略納什均衡是指在一個純策略組合中,如果給定其他的策略不變，該節(jié)點(diǎn)不會單方面改變自己的策略，否則不會使節(jié)點(diǎn)訪問代價變小。

2.存在純策略納什均衡的有限次重復(fù)博弈[1]

如果重復(fù)博弈中有惟一純策略納什均衡，那么我們怎么找出它的純策略納什均衡呢?首先看下面囚徒的困境的博弈的例子：

Image:圖1 囚徒的困境的博弈.jpg

我們現(xiàn)在考慮該博弈重復(fù)兩次的重復(fù)博弈，這可以理解成給囚徒兩次坦白機(jī)會，最后的得益是兩個階段博弈中各自得益之和．在兩次博弈過程中，雙方知道第一次博弈的結(jié)果再進(jìn)行二次博弈．用逆推歸納法來分析，先分析第二階段，也就是第二次重復(fù)時兩博弈方的選擇．很明顯，這個第二階段仍然是兩囚徒之間的一個囚徒的困境博弈，此時前一階段的結(jié)果已成為既成事實(shí)，此后又不再有任何的后續(xù)階段，因此實(shí)現(xiàn)自身當(dāng)前的最大利益是兩博弈方在該階段決策中的惟一原則．

因此我們不難得出結(jié)論，不管前一次的博弈得到的結(jié)果如何，第二階段的惟一結(jié)果就是原博弈惟一的納什均衡(坦白，坦白)，雙方得益(-5，-5)．

現(xiàn)在再回到第一階段，即第一次博弈．理性的博弈方在第一階段就對后一階段的結(jié)局非常清楚，知道第二階段的結(jié)果必然是(坦白，坦白)，因此不管第一階段的博弈結(jié)果是什么，雙方在整個重復(fù)博弈中的最終得益，都將是第一階段的基礎(chǔ)上各加-5．因此從第一階段的選擇來看，這個重復(fù)博弈與圖l中得益矩陣表示的一次性博弈實(shí)際上是完全等價的．

Image:圖2 唯一純策略均衡的有限次重復(fù)博弈.jpg

于是我們可以得出惟一純策略均衡的有限次重復(fù)博弈的結(jié)果就是重復(fù)原博弈惟一的純策略納什均衡，這就是這種重復(fù)博弈惟一的子博弈完美納什均衡路徑．

如果重復(fù)博弈中有多個純策略納什均衡，設(shè)某一市場有兩個生產(chǎn)同樣質(zhì)量產(chǎn)品的廠商，他們對產(chǎn)品的定價同有高(H)、中(M)、低(L)三種可能．設(shè)高價時市場總利潤為10個單位，中價時市場總利潤為6個單位，低價時市場總利潤為2個單位．再假設(shè)兩廠商同時決定價格，價格不等時低價格者獨(dú)享利潤，價格相等時雙方平分利潤．這時候兩廠商對價格的選擇就構(gòu)成了一個靜態(tài)博弈問題．我們看一個三價博弈的重復(fù)博弈的例子：

Image:圖3 三價博弈的重復(fù)博弈.jpg

顯然，這個得益矩陣有兩個純策略納什均衡(M，M)和(L，L)，我們也可以看出實(shí)際上兩博弈方最大的得益是策略組合(H，H)，但是它并不是納什均衡．現(xiàn)在考慮重復(fù)兩次該博弈，我們采用一種觸發(fā)策略(Trigger Strategy)：博弈雙方首先試圖合作，一旦發(fā)覺對方不合作也用不合作相報(bào)復(fù)的策略．使得在第一階段采用(H，H)成為子博弈完美納什均衡，其雙方的策略是這樣的：

博弈方1：第一次選H；如果第一次結(jié)果為(H，H)，則第二次選M，如果第一次結(jié)果為任何其他策略組合，則第二次選擇L．

博弈方2：同博弈方1．在上述雙方策略組合下，兩次重復(fù)博弈的路徑一定為第一階段(H，H)，第二階段(M，M)，這是一個子博弈完美納什均衡路徑．因?yàn)榈诙A段是一個原博弈的納什均衡，因此不可能有哪一方愿意單獨(dú)偏離；其次，第一階段的(H，H)雖然不是原來的博弈納什均衡，但是如果一方單獨(dú)偏離，采用M能增加1單位得益，這樣的后果卻是第二階段至少要損失2單位的得益，因?yàn)殡p方采用的是觸發(fā)策略，即有報(bào)復(fù)機(jī)制的策略，因此合理的選擇是堅(jiān)持H．這就說明了上述策略組合是這個兩次重復(fù)博弈的子博弈完美納什均衡．

從上述的例子我們可以看出，有多個純策略納什均衡的博弈重復(fù)兩次的子博弈完美納什均衡路徑是，第一階段采用(H，H)，第二階段采用原博弈的納什均衡(M，M)．

如果這個重復(fù)博弈重復(fù)三次，或者更多次，結(jié)論也是相似的，仍然用觸發(fā)策略，它的子博弈完美納什均衡路徑為除了最后一次以外，每次都采用(H，H)，最后一次采用原博弈的納什均衡(M，M)．

評論 | 0條評論

評論

經(jīng)理人分享

純策略納什均衡

目錄

1.什么是純策略納什均衡

2.存在純策略納什均衡的有限次重復(fù)博弈[1]