子博弈精煉納什均衡

1.子博弈精煉納什均衡概述

子博弈精煉納什均衡的創(chuàng)立者. ——1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲獎(jiǎng)?wù)摺⑷R茵哈德·澤爾騰(Reinhard Selten).

澤爾騰則在60年代中期將納什均衡概念引入動(dòng)態(tài)分析。在1965年發(fā)表《需求減少條件下寡頭壟斷模型的對(duì)策論描述》一文，提出了“子博弈精煉納什均衡”的概念，又稱(chēng)“子對(duì)策完美納什均衡”。這一研究對(duì)納什均衡進(jìn)行了第一次改進(jìn)，選擇了更具說(shuō)服力的均衡點(diǎn)。海薩尼在60年代末把不完全信息引入博弈分析。

將納什均衡中包含的不可置信的威脅策略剔除出去。它要求參與者的決策在任何時(shí)點(diǎn)上都是最優(yōu)的，決策者要“隨機(jī)應(yīng)變”，“向前看”，而不是固守舊略。

由于剔除了不可置信的威脅，在許多情況下，精煉納什均衡也就縮小了納什均衡的個(gè)數(shù)。這一點(diǎn)對(duì)預(yù)測(cè)分析是非常有意義的。

用動(dòng)態(tài)博弈理論來(lái)討論實(shí)際究竟發(fā)生哪個(gè)納什均衡。

給定“歷史”，每一個(gè)行動(dòng)選擇開(kāi)始至博弈結(jié)束構(gòu)成了一個(gè)博弈，稱(chēng)為“子博弈”。

只有當(dāng)參與人的策略在每一個(gè)子博弈中都構(gòu)成納什均衡叫做精煉納什均衡。或者說(shuō)，組成精煉納什均衡的策略必須在每一個(gè)子博弈中都是最優(yōu)的。

2.子博弈精煉納什均衡的定義

子博弈:一個(gè)擴(kuò)展式表示博弈的子博弈G是由一個(gè)單結(jié)信息集x開(kāi)始的與所有該決策結(jié)的后續(xù)結(jié)(包括終點(diǎn)結(jié))組成的能自成一個(gè)博弈的原博弈的一部分。

對(duì)于擴(kuò)展式博弈的策略組合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的納什均衡;它在每一個(gè)子博弈上也都構(gòu)成納什均衡,則它是一個(gè)子博弈精煉納什均衡。

博弈論專(zhuān)家常常使用“序慣理性”(Sequential rationality)：指不論過(guò)去發(fā)生了什么，參與人應(yīng)該在博弈的每個(gè)時(shí)點(diǎn)上最優(yōu)化自己的策略。子博弈精練納什均衡所要求的正是參與人應(yīng)該是序慣理性的。對(duì)于有限完美信息博弈，逆向歸納法是求解子博弈精煉納什均衡的最簡(jiǎn)便的方法。因?yàn)橛邢尥昝佬畔⒉┺牡拿恳粋€(gè)決策結(jié)都開(kāi)始一個(gè)子博弈。求解方法：　最后一個(gè)結(jié)點(diǎn)上的子博弈（納什均衡）→倒數(shù)第二個(gè)（納什均衡） → ······ → 初始結(jié)點(diǎn)上的子博弈（納什均衡）。

3.完全信息動(dòng)態(tài)博弈

動(dòng)態(tài)是世間萬(wàn)物的基本特征。完全信息靜態(tài)博弈只是一種獨(dú)特的理想狀態(tài)。在現(xiàn)實(shí)中，當(dāng)后一個(gè)參與人行動(dòng)時(shí)，自然會(huì)根據(jù)前者的選擇而調(diào)整自己的選擇，而前者也會(huì)理性地預(yù)期到這一點(diǎn)，所以不可能不考慮自己的選擇對(duì)他人的影響。1965年，澤爾騰通過(guò)對(duì)動(dòng)態(tài)博弈的分析，提出了“子博弈精煉納什均衡”的概念，它要求任何參與人在任何時(shí)間、地點(diǎn)的決策都是最優(yōu)的，決策者應(yīng)該隨機(jī)應(yīng)變，而不是固守前謀。這就推導(dǎo)出子博弈的概念。當(dāng)參與人的戰(zhàn)略在每一個(gè)子博弈中都構(gòu)成納什均衡時(shí)，則形成“子博弈精煉納什均衡”。也就是說(shuō)，組成“子博弈精煉納什均衡”的戰(zhàn)略必須在每一個(gè)子博弈中都是最優(yōu)的。

4.動(dòng)態(tài)博弈的納什均衡的意義

子博弈精煉納什均衡用于區(qū)分動(dòng)態(tài)博弈中的"合理納什均衡"與"不合理納什均衡",將納什均衡中包含有不可置信威脅策略的均衡剔除出去,就是說(shuō),使最后的均衡中不再包含有不可置信威脅策略的存在。

5.子博弈精煉納什均衡求法——逆向歸納法求解

逆向歸納法（Backward Induction）是求解子博弈精煉納什均衡的最簡(jiǎn)便方法。在求解子博弈精煉納什均衡時(shí),從最后一個(gè)子博弈開(kāi)始逆推上去,這就是逆向歸納法。所以逆向歸納法就是從動(dòng)態(tài)博弈的最后一個(gè)階段或最后一個(gè)子博弈開(kāi)始,逐步向前倒推以求解動(dòng)態(tài)博弈均衡的方法。

用逆向歸納法求解子博弈精煉納什均衡；承諾行動(dòng)與子博弈精煉納什均衡；逆向歸納法與子博弈精煉均衡存在的問(wèn)題。

6.子博弈精練納什均衡的應(yīng)用舉例

在表1描述的博弈模型中，每一次微觀主體間的博弈均可看作一個(gè)子博弈。子博弈精煉納什均衡包含兩層含義:

（1）它是原博弈的納什均衡；

（2）它在每一個(gè)子博弈上給出納什均衡。

子博弈精煉納什均衡就是要剔除那些只在特定情況下是合理的，而在其他情況下并不合理的行動(dòng)規(guī)則。

表１　微觀主體間的博弈

子博弈精煉納什均衡

在表1中，a代表只有一個(gè)微觀主體創(chuàng)新時(shí)所帶來(lái)的收益，c代表該微觀主體創(chuàng)新所需付出的成本。當(dāng)只有一個(gè)微觀主體進(jìn)行創(chuàng)新時(shí)將會(huì)獲得創(chuàng)新帶來(lái)的全部收益（a-c），而當(dāng)兩個(gè)主體同時(shí)創(chuàng)新時(shí)，收益將會(huì)減半(a-c)/2。一般情況下“a-c>0”，則很明顯在這個(gè)博弈過(guò)程中，（創(chuàng)新，創(chuàng)新）是一個(gè)納什均衡，更嚴(yán)格地說(shuō)，是一個(gè)嚴(yán)格優(yōu)勢(shì)策略均衡。依此類(lèi)推，可以得出，在每一次新的金融規(guī)制后，（創(chuàng)新，創(chuàng)新）這個(gè)策略都將是至下次新規(guī)制出現(xiàn)前的子博弈的納什均衡。因此，在利潤(rùn)的驅(qū)動(dòng)下，微觀主體都會(huì)選擇創(chuàng)新這樣一個(gè)策略。

舉例的進(jìn)一步分析

在市場(chǎng)進(jìn)入博弈中，在給定企業(yè)B已經(jīng)進(jìn)入的情況下，在位者的“斗爭(zhēng)”，“高價(jià)”策略已不再是最優(yōu)的，這種“斗爭(zhēng)”是不可置信的威脅，因?yàn)槎窢?zhēng)的結(jié)果是沒(méi)有利潤(rùn)；而合作會(huì)帶來(lái)50單位利潤(rùn)。所以，（進(jìn)入，高價(jià)）不是一個(gè)精煉納什均衡。剔除這個(gè)均衡，可以證明，（進(jìn)入，高價(jià)）是唯一的子博弈精煉納什均衡。

在動(dòng)態(tài)博弈中，參與人的行動(dòng)有先后順序，后行動(dòng)的參與人在自己行動(dòng)之前就可以觀察到先行動(dòng)者（參與人）的行為，并在此基礎(chǔ)上選擇相應(yīng)的策略。而且，由于先行動(dòng)者擁有后行動(dòng)者可能選擇策略的完全信息，因而先行動(dòng)者在選擇自己的策略時(shí)，就可以預(yù)先考慮自己的選擇對(duì)后行動(dòng)者選擇的影響，并采取相應(yīng)的對(duì)策。

利用房地產(chǎn)開(kāi)發(fā)的例子，討論子博弈精煉納什均衡。表２給出了靜態(tài)條件下雙方參與人的收益情況。

表2　房地產(chǎn)開(kāi)發(fā)博弈（靜態(tài)）的收收益矩陣

子博弈精煉納什均衡

從表２可以知道，該博弈有兩個(gè)納什均衡，即（Ａ開(kāi)發(fā)，Ｂ不開(kāi)發(fā)）和（Ａ不開(kāi)發(fā)，Ｂ開(kāi)發(fā)），我們無(wú)法確定是開(kāi)發(fā)商Ａ選擇開(kāi)發(fā)，開(kāi)發(fā)商Ｂ選擇不開(kāi)發(fā)，還是恰恰相反的結(jié)果。

現(xiàn)在，我們討論動(dòng)態(tài)博弈。假定房地產(chǎn)開(kāi)發(fā)商Ａ是先行動(dòng)者。在行動(dòng)之前，開(kāi)發(fā)商Ａ對(duì)對(duì)手開(kāi)發(fā)商Ｂ的策略進(jìn)行了預(yù)測(cè)。在行動(dòng)開(kāi)始之前的Ａ看來(lái)，如果不計(jì)得失，Ｂ有四種策略可供選擇：

策略一：無(wú)論Ａ是否選擇開(kāi)發(fā)，Ｂ選擇開(kāi)發(fā)。

策略二：若Ａ選擇開(kāi)發(fā)，Ｂ也選擇開(kāi)發(fā)；若Ａ選擇不開(kāi)發(fā)，Ｂ也選擇不開(kāi)發(fā)。

策略三：若Ａ選擇開(kāi)發(fā)，Ｂ就選擇不開(kāi)發(fā)；若Ａ選擇不開(kāi)發(fā)，Ｂ就選擇開(kāi)發(fā)。

策略四：無(wú)論Ａ是否選擇開(kāi)發(fā)，Ｂ都選擇不開(kāi)發(fā)。

在表２的基礎(chǔ)上，結(jié)合Ａ先行動(dòng)，Ｂ可能選擇的四種策略，不難得出表3。

表3先行動(dòng)者Ａ對(duì)Ｂ預(yù)測(cè)結(jié)果的收益矩陣

子博弈精煉納什均衡

由表3可以看出，在開(kāi)發(fā)商Ａ先行動(dòng)的情況下，開(kāi)發(fā)商Ｂ可供選擇的策略中，策略一只包括了上述兩個(gè)納什均衡中的后一種均衡，即（Ａ不開(kāi)發(fā)，Ｂ開(kāi)發(fā)），而沒(méi)有包括前一種納什均衡，即（Ａ開(kāi)發(fā)，Ｂ不開(kāi)發(fā)）；策略二上述兩種納什均衡都沒(méi)有包括；策略四只包括了上述兩種納什均衡中的前一種均衡，即（Ａ開(kāi)發(fā)，Ｂ不開(kāi)發(fā)），而未包括后一種納什均衡，即（Ａ不開(kāi)發(fā)，Ｂ開(kāi)發(fā)）；只有策略三既包括了上述兩種納什均衡中的前一種均衡，又包括了后一種均衡。也就是說(shuō)，如果Ｂ選擇策略三，那么，無(wú)論Ａ作出什么選擇，Ｂ的回應(yīng)都能達(dá)到納什均衡。反過(guò)來(lái)，在給定Ｂ會(huì)選擇策略三來(lái)回應(yīng)Ａ的選擇的前提下，開(kāi)發(fā)是Ａ的占優(yōu)選擇。因此，Ａ一定會(huì)選擇開(kāi)發(fā)

評(píng)論 | 0條評(píng)論

評(píng)論

經(jīng)理人分享

子博弈精煉納什均衡

目錄

1.子博弈精煉納什均衡概述

2.子博弈精煉納什均衡的定義

3.完全信息動(dòng)態(tài)博弈

4.動(dòng)態(tài)博弈的納什均衡的意義

5.子博弈精煉納什均衡求法——逆向歸納法求解

6.子博弈精練納什均衡的應(yīng)用舉例