嚴(yán)格劣勢策略

1.什么是嚴(yán)格劣勢策略

所謂嚴(yán)格劣勢策略是指被全面的嚴(yán)格優(yōu)勢策略壓住的那個策略，也就是說不是嚴(yán)格優(yōu)勢策略以外的策略。

所謂的嚴(yán)格優(yōu)勢策略是指不論對方采取什么策略，我采取的這個策略總比采取其他任何策略都好的策略。

所謂的雙方優(yōu)勢策略則是指雙方利益總和最大的策略。

2.嚴(yán)格劣勢策略舉例分析

一、經(jīng)典的囚徒困境

1950年，由就職于蘭德公司的梅里爾·弗拉德（Merrill Flood）和梅爾文·德雷希爾（Melvin Dresher）擬定出相關(guān)困境的理論，后來由顧問阿爾伯特·塔克（Albert Tucker）以囚徒方式闡述，并命名為“囚徒困境”。經(jīng)典的囚徒困境如下：

警方逮捕甲、乙兩名嫌疑犯，但沒有足夠證據(jù)指控二人入罪。于是警方分開囚禁嫌疑犯，分別和二人見面，并向雙方提供以下相同的選擇：

若一人認(rèn)罪并作證檢舉對方（相關(guān)術(shù)語稱“背叛”對方），而對方保持沉默，此人將即時(shí)獲釋，沉默者將判監(jiān)10年。

若二人都保持沉默（相關(guān)術(shù)語稱互相“合作”），則二人同樣判監(jiān)半年。

若二人都互相檢舉（互相“背叛”），則二人同樣判監(jiān)2年。

用表格概述如下：

	甲沉默（合作）	甲認(rèn)罪（背叛）
乙沉默（合作）	二人同服刑半年	甲即時(shí)獲釋；乙服刑10年
乙認(rèn)罪（背叛）	甲服刑10年；乙即時(shí)獲釋	二人同服刑2年

如同博弈論的其他例證，囚徒困境假定每個參與者（即“囚徒”）都是利己的，即都尋求最大自身利益，而不關(guān)心另一參與者的利益。參與者某一策略所得利益，如果在任何情況下都比其他策略要低的話，此策略稱為“嚴(yán)格劣勢”，理性的參與者絕不會選擇。另外，沒有任何其他力量干預(yù)個人決策，參與者可完全按照自己意愿選擇策略。

囚徒到底應(yīng)該選擇哪一項(xiàng)策略，才能將自己個人的刑期縮至最短？兩名囚徒由于隔絕監(jiān)禁，并不知道對方選擇；而即使他們能交談，還是未必能夠盡信對方不會反口。就個人的理性選擇而言，檢舉背叛對方所得刑期，總比沉默要來得低。試設(shè)想困境中兩名理性囚徒會如何作出選擇：

若對方沉默、背叛會讓我獲釋，所以會選擇背叛。

若對方背叛指控我，我也要指控對方才能得到較低的刑期，所以也是會選擇背叛。

二人面對的情況一樣，所以二人的理性思考都會得出相同的結(jié)論——選擇背叛。背叛是兩種策略之中的支配性策略。因此，這場博弈中唯一可能達(dá)到的納什均衡，就是雙方參與者都背叛對方，結(jié)果二人同樣服刑2年。

這場博弈的納什均衡，顯然不是顧及團(tuán)體利益的帕累托最優(yōu)解決方案。以全體利益而言，如果兩個參與者都合作保持沉默，兩人都只會被判刑半年，總體利益更高，結(jié)果也比兩人背叛對方、判刑2年的情況較佳。但根據(jù)以上假設(shè)，二人均為理性的個人，且只追求自己個人利益。均衡狀況會是兩個囚徒都選擇背叛，結(jié)果二人判決均比合作為高，總體利益較合作為低。這就是“困境”所在。例子漂亮地證明了：非零和博弈中，帕累托最優(yōu)和納什均衡是相沖突的。

在這幾種結(jié)果對比中，甲選擇坦白是他的嚴(yán)格最優(yōu)策略，因?yàn)槿氇z2年比入獄10年要好，釋放比入獄2年也要好。所以不論乙采取什么樣的策略，甲都會選擇坦白，用中國的古話說叫首先處于“不敗之地”。同樣，乙也會作如此推斷。最終的結(jié)果，雙方都會選擇坦白，選擇坦白是雙方的嚴(yán)格優(yōu)勢策略，沉默則是雙方的嚴(yán)格劣勢策略，每個囚徒都不會采取對自己明顯不利的嚴(yán)格劣勢策略。

二、智豬博弈理論

智豬博弈理論為非合作博弈論創(chuàng)始人、諾貝爾經(jīng)濟(jì)學(xué)獎得主納什提出的經(jīng)典博弈案例，適用于在經(jīng)濟(jì)領(lǐng)域中大企業(yè)和小企業(yè)之間的關(guān)系處理。

該理論的前提是一個假設(shè)。假設(shè)豬圈里有兩頭豬，一頭大豬，一頭小豬。

豬圈很長，一頭有一踏板，另一頭是飼料的出口和食槽。豬每踩一下踏板，另一邊就會有相當(dāng)于10份的豬食進(jìn)槽，但是踩踏板以后跑到食槽所需要付出的“勞動”，加起來要消耗相當(dāng)于2份的豬食。

問題是踏板和食槽分置籠子的兩端，如果有一只豬去踩踏板，另一只豬就有機(jī)會搶先吃到另一邊落下的食物。踩踏板的豬付出勞動跑到食槽的時(shí)候，坐享其成的另一頭豬早已吃了不少。

“籠中豬”博弈的具體情況如下：如果兩只豬同時(shí)踩踏板，同時(shí)跑向食槽，大豬吃進(jìn)7份，得益5份，小豬吃進(jìn)3份，實(shí)得1份；如果大豬踩踏板后跑向食槽，這時(shí)小豬搶先，吃進(jìn)4份，實(shí)得4份，大豬吃進(jìn)6份，付出2份，得益4份；如果大豬等待，小豬踩踏板，大豬先吃，吃進(jìn)9份，得益9份，小豬吃進(jìn)1份，但是付出了2份，實(shí)得-1份；如果雙方都懶得動，所得都是0。

利益分配格局決定兩頭豬的理性選擇:小豬踩踏板只能吃到一份，不踩踏板反而能吃上4份。對小豬而言，無論大豬是否踩動踏板，小豬將選擇“搭便車”策略，也就是舒舒服服地等在食槽邊，這是最好的選擇。

現(xiàn)在來看大豬。由于小豬有“等待”這個優(yōu)勢策略，大豬只剩下了兩個選擇：等待一份不得；踩踏板得到4份。所以“等待”就變成了大豬的劣勢策略，當(dāng)大豬知道小豬是不會去踩動踏板的，自己親自去踩踏板總比不踩強(qiáng)吧，只好為一點(diǎn)殘羹不知疲倦地奔忙于踏板和食槽之間。　

三、關(guān)于企業(yè)價(jià)格策略

我們來看兩個企業(yè)關(guān)于價(jià)格策略的例子。假定兩個企業(yè)都采取低價(jià)，可以各得30億元利潤；如果都采取高價(jià)，各得50億元的利潤；如果一家采取低價(jià)而另一家采取高價(jià)，那么價(jià)格高者利潤為10億元（市場份額損失較大），而另一家因?yàn)槎噤N將利潤上升到60億元。究竟兩家企業(yè)會采取什么價(jià)格策略呢？

這個博弈的格局與“囚徒困境”博弈的格局是一樣的，按照上述分析，雙方的優(yōu)勢策略是雙方都實(shí)行高價(jià)，結(jié)果雙方都能獲得各50億元的利潤，這是得到總和最大的策略。雙方的嚴(yán)格優(yōu)勢策略是都實(shí)行低價(jià)，而雙方的嚴(yán)格劣勢策略則是都實(shí)行高價(jià)。對于兩個企業(yè)來說，高價(jià)都是嚴(yán)格劣勢策略，而采取低價(jià)策略都是嚴(yán)格優(yōu)勢策略，每個企業(yè)都以對方為敵手，只關(guān)心自己的利益，在兩家企業(yè)中，一方降價(jià)的結(jié)果，必然導(dǎo)致另一方也降價(jià)跟隨，最終形成價(jià)格大戰(zhàn)。如果雙方通過合作起來，爭取雙方的優(yōu)勢策略，避開都采取各自的嚴(yán)格優(yōu)勢策略形成價(jià)格大戰(zhàn)，這對兩個企業(yè)都有意義，這我們稱之為“雙贏對局”。

評論 | 0條評論

評論

經(jīng)理人分享

嚴(yán)格劣勢策略

目錄

1.什么是嚴(yán)格劣勢策略

2.嚴(yán)格劣勢策略舉例分析