登錄

納什均衡

百科 > 博弈論 > 納什均衡

1.納什均衡簡介

納什均衡,又稱為非合作博弈均衡,是博弈論的一個重要術(shù)語,以約翰·納什命名。在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。如果兩個博弈的當事人的策略組合分別構(gòu)成各自的支配性策略,那么這個組合就被定義為納什均衡。

一個策略組合被稱為納什均衡,當每個博弈者的均衡策略都是為了達到自己期望收益的最大值,與此同時,其他所有博弈者也遵循這樣的策略。

2.納什均衡的得來

關(guān)于納什均衡的普遍意義和存在性定理的證明等奠定非合作博弈理論發(fā)展基礎(chǔ)的重要成果,是約翰·納什在普林斯頓大學攻讀博士學位時完成的。實際上,博弈論的研究起始于1944年馮·諾依曼(Von Neumann)和奧斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈論和經(jīng)濟行為》。然而卻是納什首先用嚴密的數(shù)學語言和簡明的文字準確地定義了納什均衡這個概念,并在包含“混合策略(mixed strategies)”的情況下,證明了納什均衡在n人有限博弈中的普遍存在性,從而開創(chuàng)了與諾依曼和摩根斯坦框架路線均完全不同的“非合作博弈(Non-cooperative Game)”理論,進而對“合作博弈(Cooperative Game)”和“非合作博弈”做了明確的區(qū)分和定義。阿爾伯特·塔克(Albert tucker)教授評價其論文,“這是對博弈理論的高度原創(chuàng)性和重要的貢獻。它發(fā)展了本身很有意義的n人有限非合作博弈的概念和性質(zhì)。并且它很可能開拓出許多在兩人零和問題以外的,至今尚未涉及的問題。在概念和方法兩方面,該論文都是作者的獨立創(chuàng)造?!?

3.納什均衡例子

博弈論中一個著名的例子就是囚徒困境。囚徒困境是一個非零和博弈,說的是兩個嫌疑犯甲和乙私入民宅聯(lián)手作案,被警方逮住但未獲證據(jù)。警方于是將兩個嫌疑犯分開審訊。警官分別告訴 兩個囚犯,如果你招供,而對方不招供,則你將被判刑3個月,對方將被判刑10年;若兩人都不招供則因未獲證據(jù)但私人民宅將各拘留1年;如果兩人均招供,每人將被判刑5年。于是,兩個人同時陷入招供還是不招供的兩難處境。結(jié)果是,盡管甲不知乙是否招供,但他認為自己選擇“招供”最好,因而甲會選擇“招供”,同樣乙也會選擇“招供”,兩人各判5年。而兩人都選擇不招供,雖證據(jù)不足但因私人民宅將各拘留1年的結(jié)果是不會出現(xiàn)的。

博弈矩陣 囚犯甲
招供不招供
囚犯乙 招供判刑五年甲判刑十年;乙判刑三個月
不招供甲判刑三個月;乙判刑十年判刑一年

在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。如果兩個博弈的當事人的策略組合分別構(gòu)成各自的支配性策略,那么這個組合就被定義為納什均衡。納什均衡又稱為非合作博弈均衡,是博弈論的一個重要術(shù)語,它是以美國數(shù)學家、日后成為電影《美麗心靈》主人公的納什的名字命名的。在上述囚徒困境例子中,兩個囚犯符合自己利益的選擇是坦白招供。這種兩人都選擇坦白的策略以及因此被判刑五年的結(jié)局就是“納什均衡”。

4.納什均衡的重要影響[1]

納什均衡理論奠定了現(xiàn)代主流博弈理論和經(jīng)濟理論的根本基礎(chǔ),正如克瑞普斯(Kreps,1990)在《博弈論和經(jīng)濟建?!芬粫囊灾兴f,“在過去的一二十年內(nèi),經(jīng)濟學在方法論以及語言、概念等方面,經(jīng)歷了一場溫和的革命,非合作博弈理論已經(jīng)成為范式的中心……在經(jīng)濟學或者與經(jīng)濟學原理相關(guān)的金融、會計營銷和政治科學等學科中,現(xiàn)在人們已經(jīng)很難找到不懂納什均衡能夠‘消費’近期文獻的領(lǐng)域?!奔{什均衡的重要影響可以概括為以下六個方面(謝識予,1999):

(1)改變了經(jīng)濟學的體系和結(jié)構(gòu)。非合作博弈論的概念、內(nèi)容、模型和分析工具等,均已滲透到微觀經(jīng)濟學、宏觀經(jīng)濟學、勞動經(jīng)濟學、國際經(jīng)濟學、環(huán)境經(jīng)濟學等經(jīng)濟學科的絕大部分學科領(lǐng)域,改變了這些學科領(lǐng)域的內(nèi)容和結(jié)構(gòu),成為這些學科領(lǐng)域的基本研究范式和理論分析工具,從而改變了原有經(jīng)濟學理論體系中各分支學科的內(nèi)涵。

(2)擴展了經(jīng)濟學研究經(jīng)濟問題的范圍。原有經(jīng)濟學缺乏將不確定性因素、變動環(huán)境因素以及經(jīng)濟個體之間的交互作用模式化的有效辦法,因而不能進行微觀層次經(jīng)濟問題的解剖分析。納什均衡及相關(guān)模型分析方法,包括擴展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經(jīng)濟學家們提供了深入的分析工具。

(3)加強了經(jīng)濟學研究的深度。納什均衡理論不回避經(jīng)濟個體之間直接的交互作用,不滿足于對經(jīng)濟個體之間復雜經(jīng)濟關(guān)系的簡單化處理,分析問題時不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律,強調(diào)從微觀個體行為規(guī)律的角度發(fā)現(xiàn)問題的根源,因而可以更深刻準確地理解和解釋經(jīng)濟問題。

(4)形成了基于經(jīng)典博弈的研究范式體系。即可以將各種問題或經(jīng)濟關(guān)系,按照經(jīng)典博弈的類型或特征進行分類,并根據(jù)相應(yīng)的經(jīng)典博弈的分析方法和模型進行研究,將一個領(lǐng)域所取得的經(jīng)驗方便地移植到另一個領(lǐng)域。

(5)擴大和加強了經(jīng)濟學與其他社會科學、自然科學的聯(lián)系。納什均衡之所以偉大,就因為它普通,而且普通到幾乎無處不在。納什均衡理論既適用于人類的行為規(guī)律,也適合于人類以外的其他生物的生存、運動和發(fā)展的規(guī)律。納什均衡和博弈論的橋梁作用,使經(jīng)濟學與其他社會科學、自然科學的聯(lián)系更加緊密,形成了經(jīng)濟學與其他學科相互促進的良性循環(huán)。

(6)改變了經(jīng)濟學的語言和表達方法。在進化博弈論方面相當有造詣的坎多利(Kandori,1997)對保羅·薩繆爾森(Paul Samuelson)的名言“你甚至可以使一只鸚鵡變成一個訓練有素的經(jīng)濟學家,因為它必須學習的只有兩個詞,那就是‘供給’和‘需求’”,曾做過一個幽默的引申,他說,“現(xiàn)在這只鸚鵡需要再學兩個詞,那就是‘納什均衡’”。

5.納什均衡案例分析

案例一:納什均衡在貨幣政策效應(yīng)中的應(yīng)用[2]

  •   一、博弈論下的貨幣政策博弈分析

  貨幣政策博弈分析 利用博弈論方法分析宏觀金融博弈問題。因而,博弈論是宏觀金融博弈分析的方法論基礎(chǔ)。納什(Nash) 在195O年和1951年發(fā)表了兩篇關(guān)于非合作博弈的重要文章,從一般意義上定義了非合作博弈及其均衡解.并證明了均衡的存在.基本奠定了現(xiàn)代非合作博弈論的基礎(chǔ)。因而,該均衡以后被博弈理論稱為“納什均衡”。即是指由所有的參與者的最優(yōu)策略組成的策略組合。在這種策略組合中 給定其他參與者的策略,沒有任何單個參與者有積極性選擇其他策略 也就沒有人主動去打破這種均衡。相反如果一種均衡或制度安排,如果不是一種納什均衡.即不是所有參與者的最優(yōu)策略組合 那么,這種組合就不能成立或者至少不能持續(xù)。合作博弈強調(diào)團體理性、效率和公平。而非合作博弈強調(diào)個人理性、個人最優(yōu)決策。其結(jié)果可能是有效的 也可能是無效的?,F(xiàn)實中 大量的經(jīng)濟博弈問題是非合作博弈。非合作博弈理論的發(fā)展為其在經(jīng)濟研究中的廣泛應(yīng)用創(chuàng)造了條件并推動了合作博弈的進一步發(fā)展。

  納什均衡假定博弈參與者在選擇自己的策略時,把其他參與者的策略當做給定的。而不考慮自己的選擇如何影響博弈對手的選擇。這個假定在靜態(tài)博弈下是成立的,但在動態(tài)博弈下卻不成立。

  在靜態(tài)博弈中,所有參與者同時行動,不可能在自己采取行動前觀察到其他人的行動 因而就無暇反應(yīng)。但在動態(tài)博弈中 一方行動在先 另一方行動在后.后者自然會根據(jù)前者的選擇而調(diào)整自己的選擇,前者自然會理性地預(yù)期到這一點,所以不能不考慮自己的選擇對其他參與者的影響,由于決策者不考慮自己的選擇對他人選擇的影響,納什均衡允許了不可置信威脅的存在。1965年澤爾騰(Selten) 將納什均衡的概念引入了動態(tài)分析定義了子博弈精練納什均衡” 的概念。將不可置信的威脅策略從納什均衡中剔除出去,從而解決了完全信息動態(tài)博弈均衡求解問題 將不可置信的策略變成可置信策略的行動 即經(jīng)濟學中的 承諾行動”。如果當事人不履行其承諾時將為之付出相應(yīng)的代價 這種承諾就是可置信的,否則就是不可置信的。該概念的提出,對利用博弈論方法研究貨幣政策問題奠定了基礎(chǔ)。

  •   二、納什均衡在貨幣政策效應(yīng)中的應(yīng)用

  在理性預(yù)期條件下,我們考察一期的貨幣政策博弈均衡。假定中央銀行的目標成本函數(shù)為:

  其中:π為通貨膨脹率;y為實際經(jīng)濟增長率;y * 為中央銀行期望的經(jīng)濟增長率。

  根據(jù)盧卡斯供給曲線:y = yn + α(π ? πe),α > 0.其中:y_t^n為潛在經(jīng)濟增長率;pi^e_t為公眾的預(yù)期通貨膨脹率:a表示非預(yù)期通膨脹對經(jīng)濟的影響程度,即總供給曲線的斜率。

  假定α=1,即:y = yn + (π ? πα)

  同時假定中央銀行對貨幣增長有完全的控制能力.公眾的預(yù)期完全理性 不存在真實供給沖擊和貨幣流通速度變化的影響.通貨膨脹率π等于貨幣供給增長率m,通貨膨脹預(yù)期πα。等于貨幣供給增長率me,中央銀行期望的經(jīng)濟增長率與潛在的經(jīng)濟增長率相等。有Z=frac{1}{2}m^2+frac{1}{2}(m-m^e)^2。

  令公眾的目標函數(shù)為避免由于預(yù)期誤差導致的通貨膨脹之害,因此可把公眾的效用函數(shù)定義為:U = ? (m ? me)2

  可得該貨幣政策博弈的支付矩陣如下:

中央銀行策略(m)公眾策略(me)
01
0(0,0)(0,0,5)
1(1,-1)(0,5,0)

 矩陣中m=0表示中央銀行選擇零的貨幣增長率 m=1表示中央銀行選擇正的貨幣增長率:公眾策略的含義同上。由支付矩陣可知 對中央銀行來說,m=1的效用嚴格優(yōu)于m=0的效用.m=1為其最優(yōu)策略。在理性預(yù)期下,公眾迅速認識到中央銀行會選擇正的貨幣增長率,其必然選擇m=1以使其效用最大化,該博弈模型的納什均衡是中央銀行選擇正的貨幣增長率,公眾選擇正的通貨膨脹率預(yù)期,效用函數(shù)為(0,5,0)。均衡結(jié)果顯示貨幣政策只會影響通貨膨脹率而真實產(chǎn)出不變。

  貨幣政策博弈具體表現(xiàn)為貨幣政策的決策和執(zhí)行過程中存在動態(tài)不一致性問題。博弈主體在當前做出的關(guān)于未來的最優(yōu)決策,在決策執(zhí)行時對決策制定者已不再是最優(yōu)決策.因而他必然要調(diào)整其決策。例如 在公眾預(yù)期形成之前 對于貨幣政策制定者來說,零通貨膨脹(或較低通貨膨脹)可能是最優(yōu)的選擇。因而為了影響公眾預(yù)期,他可能在此選擇和許諾他將實行零通貨膨脹(或較低通貨膨脹)。但是,當公眾預(yù)期形成以后零通貨膨脹(或較低通貨膨脹)對政策制定者來說已不是最優(yōu)決策。為了獲得非預(yù)期通貨膨脹對經(jīng)濟增長和就業(yè)增加的刺激作用,政策制定者必須實行正的(或更高的)通貨膨脹.在完全信息條件下公眾知道政策制定者會這樣做.因而他的許諾是不可置信的。具有理性和完全信息的公眾不會被其愚弄.最后結(jié)果必然是被預(yù)期到的正的(或更高的)通貨膨脹。相機選擇貨幣政策的這種通貨膨脹(通貨緊縮)傾向是由該博弈結(jié)構(gòu)內(nèi)生性決定的,即該均衡(納什均衡)允許了不可置信的威脅策略的存在,中央銀行關(guān)于零通脹(或低通脹)的許諾是不可置信的。

  要消除貨幣政策的通貨膨脹(通貨緊縮)傾向 必須消除這種不可置信因素——中央銀行在公眾預(yù)期形成之前承諾其將毫不改變地執(zhí)行單一規(guī)則的貨幣政策 通過承諾行動中央銀行獲得了影響公眾預(yù)期的能力。因而,在選擇其貨幣供給增長率時.就必須考慮它對公眾預(yù)期的立即和充分的影響 就不能期望制造非預(yù)期通貨膨脹(通貨緊縮)來刺激經(jīng)濟、增加就業(yè)或為預(yù)算融資。這就是說,提高政策的穩(wěn)定性和可信程度是消除通貨膨脹(通貨緊縮)的關(guān)鍵。

評論  |   0條評論