登錄

協(xié)調(diào)博弈

百科 > 博弈論 > 協(xié)調(diào)博弈

1.什么是協(xié)調(diào)博弈

協(xié)調(diào)博弈,是指在博弈所定義的收益空間中,任何均衡點(diǎn)都符合以下條件:即

(1)在給定其他參與人行為策略的條件下,沒有人有激勵(lì)改變其行為策略;

(2)沒有參與者希望其他參與者會(huì)愿意改變其行為。

2.協(xié)調(diào)博弈概述[1]

Jasmina Arifovic(2000); Hans Carlsson, Mattias Ganslandt(1998); Paul G.Straub(1995)等認(rèn)為協(xié)調(diào)博弈就是存在多個(gè)能夠進(jìn)行帕累托排序納什均衡的博弈;

Vincent P.Crawford and Hans Haller(1990);Vincent P.Crawford(1995)等認(rèn)為協(xié)調(diào)博弈是參與人對(duì)不同策略組合有相同偏好的博弈,如果其他人能夠正確地預(yù)期,那么在多個(gè)納什均衡中會(huì)存在唯一解,即均衡選擇依賴參與人之間對(duì)博弈進(jìn)行有充分相似的信念

他們描述的側(cè)重點(diǎn)不同,前者強(qiáng)調(diào)均衡多重性,后者強(qiáng)調(diào)參與人行為選擇信念的一致性。當(dāng)然,沒有多重均衡就不存在行為選擇信念,有了多重均衡就需要探討行為選擇信念的形成過程,參與人之間行為預(yù)期是協(xié)調(diào)博弈均衡選擇問題的核心之所在。

根據(jù)均衡選擇時(shí)參與人之間是相同行動(dòng)的行為預(yù)期還是不同行動(dòng)的行為預(yù)期而把協(xié)調(diào)博弈分為對(duì)稱協(xié)調(diào)博弈與非對(duì)稱協(xié)調(diào)博弈。

3.協(xié)調(diào)博弈典型實(shí)例[2]

夏娃靠左夏娃靠右
亞當(dāng)靠左3,30,0
亞當(dāng)靠右0,03,3

表:交通博弈

協(xié)調(diào)博弈的最為經(jīng)典的弈局出現(xiàn)在“交通博弈”中。下表中的收益矩陣給出了一個(gè)交通博弈的收益分布。觀察該矩陣可以發(fā)現(xiàn):該矩陣有三個(gè)納什均衡,即(靠左,靠左)、(靠右,靠右)以及一個(gè)靠左和靠右各占50%概率的混合動(dòng)機(jī)策略均衡。因此,只要給定對(duì)方的選擇,參與者就沒有激勵(lì)偏離均衡策略;或者即使不給定對(duì)方的策略,參與者也只能通過協(xié)調(diào)來實(shí)現(xiàn)均衡。

顯然,在這種博弈中,每個(gè)參與者的策略問題是:他希望和他的對(duì)手就策略選擇進(jìn)行“協(xié)調(diào)”,因?yàn)椴还苁欠窠o定對(duì)手的策略,協(xié)調(diào)的結(jié)果總是最好的。森在1967年的論文[3]中,將一個(gè)協(xié)調(diào)博弈稱為“信心博弈”。他指出,協(xié)調(diào)博弈與囚徒困境博弈剛好相反,每個(gè)參與者選擇策略A或B,僅僅需要確信對(duì)方也會(huì)相應(yīng)地選擇A或B。他們不像合作博弈那樣需要一個(gè)有約束力的契約之類的東西,而是更需要在彼此之間確立一種相互信任的信心。

如果我們考慮將上述關(guān)于交通的協(xié)調(diào)博弈擴(kuò)展為,(1)在固定參與者之間進(jìn)行的重復(fù)博弈,或(2)在特定的群體系統(tǒng)內(nèi)部非固定參與者之間進(jìn)行的超博弈,那么就不難想象,與其每次出現(xiàn)時(shí)都去嘗試解決這個(gè)博弈,遠(yuǎn)不如在行為人之間建立起某種行為或慣例的穩(wěn)定的均衡模式,進(jìn)而使得參與人在此后遇到類似問題時(shí)都可以加以遵循,而不需要反復(fù)支付信息成本和交易成本。但協(xié)調(diào)博弈的一個(gè)問題在于,均衡解具有不確定性和多樣性,因此哪種均衡的規(guī)則將被選擇具有隨機(jī)特征。因此,在習(xí)俗層面上講,協(xié)調(diào)博弈的均衡規(guī)則是多樣的。但不管怎樣,只要相應(yīng)的一種行為模式被廣泛接受,并被自覺遵從,就會(huì)形成習(xí)俗或自發(fā)秩序,并且有助于包括參與者在內(nèi)的所有群體成員,避免類似弈局中無效率的非均衡收益。

4.協(xié)調(diào)博弈與選舉[4]

在堯舜時(shí)代,自然資源相對(duì)豐富,人性淳樸,人們?yōu)闋?zhēng)奪資源而進(jìn)行爭(zhēng)斗的情形相對(duì)較少。但是隨著時(shí)間的推移,人口的增加,以及人性的復(fù)雜化,為爭(zhēng)奪資源所進(jìn)行的爭(zhēng)斗就愈加激烈,且手段也花樣百出了。特別是在目前的市場(chǎng)經(jīng)濟(jì)情況下,人們以無限追逐物資利益為目標(biāo),一個(gè)人能否在激烈的競(jìng)爭(zhēng)中取得資源控制權(quán)就成為一個(gè)人或者一個(gè)單位生存及發(fā)展的關(guān)鍵要素。對(duì)于市場(chǎng)經(jīng)濟(jì)還欠成熟,法制傳統(tǒng)還比較欠缺的國度來說,不擇手段地進(jìn)行資源控制權(quán)爭(zhēng)奪就特別重要。因此,一些單位在與其它單位的資源或者市場(chǎng)控制權(quán)爭(zhēng)奪中,實(shí)際上就是在玩“協(xié)調(diào)博弈 ”——給定其它單位不擇手段地爭(zhēng)奪資源,己方的最優(yōu)策略就是不擇手段地爭(zhēng)奪資源。但是,能否有能力不擇手段地去爭(zhēng)奪資源是依賴于單位“領(lǐng)導(dǎo)”的人格素質(zhì)的。

一般而論,能不擇手段進(jìn)行資源爭(zhēng)奪的人通常是“膽大”的人,俗話說:“餓死膽小的,撐死膽大的”就是這個(gè)意思。而膽大的人一般又不太在乎社會(huì)公眾輿論或者不太在乎社會(huì)規(guī)范的約束,通常就在“德行”上得分不高——即所謂大奸大惡之人,如三國時(shí)的曹操。所以,給定其它競(jìng)爭(zhēng)性單位推選“大奸大惡之人”作領(lǐng)導(dǎo),該單位也有動(dòng)機(jī)推選自己的“大奸大惡之人”作領(lǐng)導(dǎo),讓他去迎戰(zhàn)競(jìng)爭(zhēng)方的“大奸大惡之人”是恰當(dāng)?shù)?。?dāng)然,“大奸大惡之人”也可能并不受本單位廣大人民群眾的歡迎,但是作為集體的生存與發(fā)展,廣大人民群眾在一定程度上也可能容忍,讓他們實(shí)際上并不喜歡的人去當(dāng)他們的領(lǐng)導(dǎo),這叫做“以毒攻毒 ”!如果競(jìng)爭(zhēng)對(duì)手推選他們的領(lǐng)導(dǎo)是德高望重之人而非“大奸大惡之人”,本單位推選“大奸大惡之人”也是要占便宜的,因?yàn)樵跔?zhēng)奪資源上德高望重之人是斗不過 “大奸大惡之人”的;這樣一來,每個(gè)單位都選擇“大奸大惡之人”就是“占優(yōu)戰(zhàn)略”的了。也就是說,無論競(jìng)爭(zhēng)對(duì)手推選什么樣的人作領(lǐng)導(dǎo),本單位都推選“大奸大惡之人”作領(lǐng)導(dǎo)是最優(yōu)的。這樣的博弈實(shí)際上是“囚徒困境 ”。但是,用“囚徒困境”來描述實(shí)際現(xiàn)象沒有用“協(xié)調(diào)博弈”恰當(dāng)。理由是,通?!按蠹榇髳褐恕币矔?huì)損害本單位廣大人民群眾的利益。如果競(jìng)爭(zhēng)對(duì)手單位推選德高望重之人當(dāng)他們的領(lǐng)導(dǎo),本單位廣大人民群眾通常也會(huì)推選本單位的德高望重之人作本單位領(lǐng)導(dǎo)的。因?yàn)楸M管本單位的領(lǐng)導(dǎo)是德高望重之人時(shí)不會(huì)比“大奸大惡之人”爭(zhēng)奪帶來更多的資源,但他也通常會(huì)比“大奸大惡之人”更少地?fù)p害本單位廣大人民群眾的利益,甚至通常還會(huì)增進(jìn)本單位廣大人民群眾的利益。

一個(gè)更為強(qiáng)有力的原因是來自柏克利加州大學(xué)的Rabin教授的公平博弈觀點(diǎn)。他根據(jù)近年來心理學(xué)實(shí)驗(yàn)的發(fā)現(xiàn)概括出人們普遍表現(xiàn)出的”互惠互損“行為準(zhǔn)則。Rabin(1993)的一個(gè)有價(jià)值的貢獻(xiàn)是把“公平性”(fairness)定義為“當(dāng)別人對(duì)你友善良時(shí)你也對(duì)別人友善,當(dāng)別人對(duì)你不善時(shí)你也對(duì)別人不善(即“投桃報(bào)李”和“以牙還牙”),而且他的獨(dú)特貢獻(xiàn)是將這種概念給予了明確的規(guī)定,即“如果你在損失自己效用(收入,利益等)情況下去損害別人的效用(收入,利益等),就被定義為你對(duì)別人不善;如果你在損失自己效用(收入,利益等)情況下去增進(jìn)別人的效用(收入,利益等),就被定義為你對(duì)別人友善?!?

心理學(xué)的諸多實(shí)驗(yàn)證據(jù)表明人的行為在許多情形下是遵循這樣定義的“公平性”規(guī)則的,特別是在按照這種規(guī)則作出反應(yīng)時(shí)所可能造成的潛在物質(zhì)利益損失不太大的情況下更是如此。這樣,當(dāng)競(jìng)爭(zhēng)對(duì)手單位推選“大奸大惡之人”作他們的領(lǐng)導(dǎo)時(shí),事實(shí)上他們是以放棄讓“大奸大惡之人”為他們帶來更多資源的同時(shí)來增進(jìn)本單位廣大人民群眾的利益。此時(shí),按照Rabin的理論,本單位廣大人民群眾也會(huì)放棄讓“大奸大惡之人”可能帶來更多資源的好處而推選讓德高望重之人來作本單位的領(lǐng)導(dǎo)。

評(píng)論  |   0條評(píng)論