登錄

嚴(yán)格劣勢(shì)策略

百科 > 博弈論 > 嚴(yán)格劣勢(shì)策略

1.什么是嚴(yán)格劣勢(shì)策略

所謂嚴(yán)格劣勢(shì)策略是指被全面的嚴(yán)格優(yōu)勢(shì)策略壓住的那個(gè)策略,也就是說(shuō)不是嚴(yán)格優(yōu)勢(shì)策略以外的策略。

所謂的嚴(yán)格優(yōu)勢(shì)策略是指不論對(duì)方采取什么策略,我采取的這個(gè)策略總比采取其他任何策略都好的策略。

所謂的雙方優(yōu)勢(shì)策略則是指雙方利益總和最大的策略。

2.嚴(yán)格劣勢(shì)策略舉例分析

一、經(jīng)典的囚徒困境

1950年,由就職于蘭德公司的梅里爾·弗拉德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關(guān)困境的理論,后來(lái)由顧問(wèn)阿爾伯特·塔克(Albert Tucker)以囚徒方式闡述,并命名為“囚徒困境”。經(jīng)典的囚徒困境如下:

警方逮捕甲、乙兩名嫌疑犯,但沒(méi)有足夠證據(jù)指控二人入罪。于是警方分開(kāi)囚禁嫌疑犯,分別和二人見(jiàn)面,并向雙方提供以下相同的選擇:

  • 若一人認(rèn)罪并作證檢舉對(duì)方(相關(guān)術(shù)語(yǔ)稱“背叛”對(duì)方),而對(duì)方保持沉默,此人將即時(shí)獲釋,沉默者將判監(jiān)10年。
  • 若二人都保持沉默(相關(guān)術(shù)語(yǔ)稱互相“合作”),則二人同樣判監(jiān)半年。
  • 若二人都互相檢舉(互相“背叛”),則二人同樣判監(jiān)2年。

用表格概述如下:

甲沉默(合作) 甲認(rèn)罪(背叛)
乙沉默(合作) 二人同服刑半年 甲即時(shí)獲釋;乙服刑10年
乙認(rèn)罪(背叛) 甲服刑10年;乙即時(shí)獲釋 二人同服刑2年

如同博弈論的其他例證,囚徒困境假定每個(gè)參與者(即“囚徒”)都是利己的,即都尋求最大自身利益,而不關(guān)心另一參與者的利益。參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為“嚴(yán)格劣勢(shì)”,理性的參與者絕不會(huì)選擇。另外,沒(méi)有任何其他力量干預(yù)個(gè)人決策,參與者可完全按照自己意愿選擇策略。

囚徒到底應(yīng)該選擇哪一項(xiàng)策略,才能將自己個(gè)人的刑期縮至最短??jī)擅敉接捎诟艚^監(jiān)禁,并不知道對(duì)方選擇;而即使他們能交談,還是未必能夠盡信對(duì)方不會(huì)反口。就個(gè)人的理性選擇而言,檢舉背叛對(duì)方所得刑期,總比沉默要來(lái)得低。試設(shè)想困境中兩名理性囚徒會(huì)如何作出選擇:

  • 若對(duì)方沉默、背叛會(huì)讓我獲釋,所以會(huì)選擇背叛。
  • 若對(duì)方背叛指控我,我也要指控對(duì)方才能得到較低的刑期,所以也是會(huì)選擇背叛。

二人面對(duì)的情況一樣,所以二人的理性思考都會(huì)得出相同的結(jié)論——選擇背叛。背叛是兩種策略之中的支配性策略。因此,這場(chǎng)博弈中唯一可能達(dá)到的納什均衡,就是雙方參與者都背叛對(duì)方,結(jié)果二人同樣服刑2年。

這場(chǎng)博弈的納什均衡,顯然不是顧及團(tuán)體利益的帕累托最優(yōu)解決方案。以全體利益而言,如果兩個(gè)參與者都合作保持沉默,兩人都只會(huì)被判刑半年,總體利益更高,結(jié)果也比兩人背叛對(duì)方、判刑2年的情況較佳。但根據(jù)以上假設(shè),二人均為理性的個(gè)人,且只追求自己個(gè)人利益。均衡狀況會(huì)是兩個(gè)囚徒都選擇背叛,結(jié)果二人判決均比合作為高,總體利益較合作為低。這就是“困境”所在。例子漂亮地證明了:非零和博弈中,帕累托最優(yōu)納什均衡是相沖突的。

在這幾種結(jié)果對(duì)比中,甲選擇坦白是他的嚴(yán)格最優(yōu)策略,因?yàn)槿氇z2年比入獄10年要好,釋放比入獄2年也要好。所以不論乙采取什么樣的策略,甲都會(huì)選擇坦白,用中國(guó)的古話說(shuō)叫首先處于“不敗之地”。同樣,乙也會(huì)作如此推斷。最終的結(jié)果,雙方都會(huì)選擇坦白,選擇坦白是雙方的嚴(yán)格優(yōu)勢(shì)策略,沉默則是雙方的嚴(yán)格劣勢(shì)策略,每個(gè)囚徒都不會(huì)采取對(duì)自己明顯不利的嚴(yán)格劣勢(shì)策略。

二、智豬博弈理論

智豬博弈理論為非合作博弈論創(chuàng)始人、諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主納什提出的經(jīng)典博弈案例,適用于在經(jīng)濟(jì)領(lǐng)域中大企業(yè)和小企業(yè)之間的關(guān)系處理。

該理論的前提是一個(gè)假設(shè)。假設(shè)豬圈里有兩頭豬,一頭大豬,一頭小豬。

豬圈很長(zhǎng),一頭有一踏板,另一頭是飼料的出口和食槽。豬每踩一下踏板,另一邊就會(huì)有相當(dāng)于10份的豬食進(jìn)槽,但是踩踏板以后跑到食槽所需要付出的“勞動(dòng)”,加起來(lái)要消耗相當(dāng)于2份的豬食。

問(wèn)題是踏板和食槽分置籠子的兩端,如果有一只豬去踩踏板,另一只豬就有機(jī)會(huì)搶先吃到另一邊落下的食物。踩踏板的豬付出勞動(dòng)跑到食槽的時(shí)候,坐享其成的另一頭豬早已吃了不少。

“籠中豬”博弈的具體情況如下:如果兩只豬同時(shí)踩踏板,同時(shí)跑向食槽,大豬吃進(jìn)7份,得益5份,小豬吃進(jìn)3份,實(shí)得1份;如果大豬踩踏板后跑向食槽,這時(shí)小豬搶先,吃進(jìn)4份,實(shí)得4份,大豬吃進(jìn)6份,付出2份,得益4份;如果大豬等待,小豬踩踏板,大豬先吃,吃進(jìn)9份,得益9份,小豬吃進(jìn)1份,但是付出了2份,實(shí)得-1份;如果雙方都懶得動(dòng),所得都是0。

利益分配格局決定兩頭豬的理性選擇:小豬踩踏板只能吃到一份,不踩踏板反而能吃上4份。對(duì)小豬而言,無(wú)論大豬是否踩動(dòng)踏板,小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊,這是最好的選擇。

現(xiàn)在來(lái)看大豬。由于小豬有“等待”這個(gè)優(yōu)勢(shì)策略,大豬只剩下了兩個(gè)選擇:等待一份不得;踩踏板得到4份。所以“等待”就變成了大豬的劣勢(shì)策略,當(dāng)大豬知道小豬是不會(huì)去踩動(dòng)踏板的,自己親自去踩踏板總比不踩強(qiáng)吧,只好為一點(diǎn)殘羹不知疲倦地奔忙于踏板和食槽之間?!?

三、關(guān)于企業(yè)價(jià)格策略

我們來(lái)看兩個(gè)企業(yè)關(guān)于價(jià)格策略的例子。假定兩個(gè)企業(yè)都采取低價(jià),可以各得30億元利潤(rùn);如果都采取高價(jià),各得50億元的利潤(rùn);如果一家采取低價(jià)而另一家采取高價(jià),那么價(jià)格高者利潤(rùn)為10億元(市場(chǎng)份額損失較大),而另一家因?yàn)槎噤N將利潤(rùn)上升到60億元。究竟兩家企業(yè)會(huì)采取什么價(jià)格策略呢?

這個(gè)博弈的格局與“囚徒困境”博弈的格局是一樣的,按照上述分析,雙方的優(yōu)勢(shì)策略是雙方都實(shí)行高價(jià),結(jié)果雙方都能獲得各50億元的利潤(rùn),這是得到總和最大的策略。雙方的嚴(yán)格優(yōu)勢(shì)策略是都實(shí)行低價(jià),而雙方的嚴(yán)格劣勢(shì)策略則是都實(shí)行高價(jià)。對(duì)于兩個(gè)企業(yè)來(lái)說(shuō),高價(jià)都是嚴(yán)格劣勢(shì)策略,而采取低價(jià)策略都是嚴(yán)格優(yōu)勢(shì)策略,每個(gè)企業(yè)都以對(duì)方為敵手,只關(guān)心自己的利益,在兩家企業(yè)中,一方降價(jià)的結(jié)果,必然導(dǎo)致另一方也降價(jià)跟隨,最終形成價(jià)格大戰(zhàn)。如果雙方通過(guò)合作起來(lái),爭(zhēng)取雙方的優(yōu)勢(shì)策略,避開(kāi)都采取各自的嚴(yán)格優(yōu)勢(shì)策略形成價(jià)格大戰(zhàn),這對(duì)兩個(gè)企業(yè)都有意義,這我們稱之為“雙贏對(duì)局”。

評(píng)論  |   0條評(píng)論