納什均衡
1.納什均衡簡介
納什均衡,又稱為非合作博弈均衡,是博弈論的一個(gè)重要術(shù)語,以約翰·納什命名。在一個(gè)博弈過程中,無論對方的策略選擇如何,當(dāng)事人一方都會(huì)選擇某個(gè)確定的策略,則該策略被稱作支配性策略。如果兩個(gè)博弈的當(dāng)事人的策略組合分別構(gòu)成各自的支配性策略,那么這個(gè)組合就被定義為納什均衡。
一個(gè)策略組合被稱為納什均衡,當(dāng)每個(gè)博弈者的均衡策略都是為了達(dá)到自己期望收益的最大值,與此同時(shí),其他所有博弈者也遵循這樣的策略。
2.納什均衡的得來
關(guān)于納什均衡的普遍意義和存在性定理的證明等奠定非合作博弈理論發(fā)展基礎(chǔ)的重要成果,是約翰·納什在普林斯頓大學(xué)攻讀博士學(xué)位時(shí)完成的。實(shí)際上,博弈論的研究起始于1944年馮·諾依曼(Von Neumann)和奧斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈論和經(jīng)濟(jì)行為》。然而卻是納什首先用嚴(yán)密的數(shù)學(xué)語言和簡明的文字準(zhǔn)確地定義了納什均衡這個(gè)概念,并在包含“混合策略(mixed strategies)”的情況下,證明了納什均衡在n人有限博弈中的普遍存在性,從而開創(chuàng)了與諾依曼和摩根斯坦框架路線均完全不同的“非合作博弈(Non-cooperative Game)”理論,進(jìn)而對“合作博弈(Cooperative Game)”和“非合作博弈”做了明確的區(qū)分和定義。阿爾伯特·塔克(Albert tucker)教授評價(jià)其論文,“這是對博弈理論的高度原創(chuàng)性和重要的貢獻(xiàn)。它發(fā)展了本身很有意義的n人有限非合作博弈的概念和性質(zhì)。并且它很可能開拓出許多在兩人零和問題以外的,至今尚未涉及的問題。在概念和方法兩方面,該論文都是作者的獨(dú)立創(chuàng)造?!?
3.納什均衡例子
博弈論中一個(gè)著名的例子就是囚徒困境。囚徒困境是一個(gè)非零和博弈,說的是兩個(gè)嫌疑犯甲和乙私入民宅聯(lián)手作案,被警方逮住但未獲證據(jù)。警方于是將兩個(gè)嫌疑犯分開審訊。警官分別告訴 兩個(gè)囚犯,如果你招供,而對方不招供,則你將被判刑3個(gè)月,對方將被判刑10年;若兩人都不招供則因未獲證據(jù)但私人民宅將各拘留1年;如果兩人均招供,每人將被判刑5年。于是,兩個(gè)人同時(shí)陷入招供還是不招供的兩難處境。結(jié)果是,盡管甲不知乙是否招供,但他認(rèn)為自己選擇“招供”最好,因而甲會(huì)選擇“招供”,同樣乙也會(huì)選擇“招供”,兩人各判5年。而兩人都選擇不招供,雖證據(jù)不足但因私人民宅將各拘留1年的結(jié)果是不會(huì)出現(xiàn)的。
博弈矩陣 | 囚犯甲 | ||
---|---|---|---|
招供 | 不招供 | ||
囚犯乙 | 招供 | 判刑五年 | 甲判刑十年;乙判刑三個(gè)月 |
不招供 | 甲判刑三個(gè)月;乙判刑十年 | 判刑一年 |
在一個(gè)博弈過程中,無論對方的策略選擇如何,當(dāng)事人一方都會(huì)選擇某個(gè)確定的策略,則該策略被稱作支配性策略。如果兩個(gè)博弈的當(dāng)事人的策略組合分別構(gòu)成各自的支配性策略,那么這個(gè)組合就被定義為納什均衡。納什均衡又稱為非合作博弈均衡,是博弈論的一個(gè)重要術(shù)語,它是以美國數(shù)學(xué)家、日后成為電影《美麗心靈》主人公的納什的名字命名的。在上述囚徒困境例子中,兩個(gè)囚犯符合自己利益的選擇是坦白招供。這種兩人都選擇坦白的策略以及因此被判刑五年的結(jié)局就是“納什均衡”。
4.納什均衡的重要影響[1]
納什均衡理論奠定了現(xiàn)代主流博弈理論和經(jīng)濟(jì)理論的根本基礎(chǔ),正如克瑞普斯(Kreps,1990)在《博弈論和經(jīng)濟(jì)建模》一書的引言中所說,“在過去的一二十年內(nèi),經(jīng)濟(jì)學(xué)在方法論以及語言、概念等方面,經(jīng)歷了一場溫和的革命,非合作博弈理論已經(jīng)成為范式的中心……在經(jīng)濟(jì)學(xué)或者與經(jīng)濟(jì)學(xué)原理相關(guān)的金融、會(huì)計(jì)、營銷和政治科學(xué)等學(xué)科中,現(xiàn)在人們已經(jīng)很難找到不懂納什均衡能夠‘消費(fèi)’近期文獻(xiàn)的領(lǐng)域?!奔{什均衡的重要影響可以概括為以下六個(gè)方面(謝識(shí)予,1999):
(1)改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。非合作博弈論的概念、內(nèi)容、模型和分析工具等,均已滲透到微觀經(jīng)濟(jì)學(xué)、宏觀經(jīng)濟(jì)學(xué)、勞動(dòng)經(jīng)濟(jì)學(xué)、國際經(jīng)濟(jì)學(xué)、環(huán)境經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)學(xué)科的絕大部分學(xué)科領(lǐng)域,改變了這些學(xué)科領(lǐng)域的內(nèi)容和結(jié)構(gòu),成為這些學(xué)科領(lǐng)域的基本研究范式和理論分析工具,從而改變了原有經(jīng)濟(jì)學(xué)理論體系中各分支學(xué)科的內(nèi)涵。
(2)擴(kuò)展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問題的范圍。原有經(jīng)濟(jì)學(xué)缺乏將不確定性因素、變動(dòng)環(huán)境因素以及經(jīng)濟(jì)個(gè)體之間的交互作用模式化的有效辦法,因而不能進(jìn)行微觀層次經(jīng)濟(jì)問題的解剖分析。納什均衡及相關(guān)模型分析方法,包括擴(kuò)展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經(jīng)濟(jì)學(xué)家們提供了深入的分析工具。
(3)加強(qiáng)了經(jīng)濟(jì)學(xué)研究的深度。納什均衡理論不回避經(jīng)濟(jì)個(gè)體之間直接的交互作用,不滿足于對經(jīng)濟(jì)個(gè)體之間復(fù)雜經(jīng)濟(jì)關(guān)系的簡單化處理,分析問題時(shí)不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律,強(qiáng)調(diào)從微觀個(gè)體行為規(guī)律的角度發(fā)現(xiàn)問題的根源,因而可以更深刻準(zhǔn)確地理解和解釋經(jīng)濟(jì)問題。
(4)形成了基于經(jīng)典博弈的研究范式體系。即可以將各種問題或經(jīng)濟(jì)關(guān)系,按照經(jīng)典博弈的類型或特征進(jìn)行分類,并根據(jù)相應(yīng)的經(jīng)典博弈的分析方法和模型進(jìn)行研究,將一個(gè)領(lǐng)域所取得的經(jīng)驗(yàn)方便地移植到另一個(gè)領(lǐng)域。
(5)擴(kuò)大和加強(qiáng)了經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系。納什均衡之所以偉大,就因?yàn)樗胀?,而且普通到幾乎無處不在。納什均衡理論既適用于人類的行為規(guī)律,也適合于人類以外的其他生物的生存、運(yùn)動(dòng)和發(fā)展的規(guī)律。納什均衡和博弈論的橋梁作用,使經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系更加緊密,形成了經(jīng)濟(jì)學(xué)與其他學(xué)科相互促進(jìn)的良性循環(huán)。
(6)改變了經(jīng)濟(jì)學(xué)的語言和表達(dá)方法。在進(jìn)化博弈論方面相當(dāng)有造詣的坎多利(Kandori,1997)對保羅·薩繆爾森(Paul Samuelson)的名言“你甚至可以使一只鸚鵡變成一個(gè)訓(xùn)練有素的經(jīng)濟(jì)學(xué)家,因?yàn)樗仨殞W(xué)習(xí)的只有兩個(gè)詞,那就是‘供給’和‘需求’”,曾做過一個(gè)幽默的引申,他說,“現(xiàn)在這只鸚鵡需要再學(xué)兩個(gè)詞,那就是‘納什均衡’”。
5.納什均衡案例分析
案例一:納什均衡在貨幣政策效應(yīng)中的應(yīng)用[2]
一、博弈論下的貨幣政策博弈分析
貨幣政策博弈分析 利用博弈論方法分析宏觀金融博弈問題。因而,博弈論是宏觀金融博弈分析的方法論基礎(chǔ)。納什(Nash) 在195O年和1951年發(fā)表了兩篇關(guān)于非合作博弈的重要文章,從一般意義上定義了非合作博弈及其均衡解.并證明了均衡的存在.基本奠定了現(xiàn)代非合作博弈論的基礎(chǔ)。因而,該均衡以后被博弈理論稱為“納什均衡”。即是指由所有的參與者的最優(yōu)策略組成的策略組合。在這種策略組合中 給定其他參與者的策略,沒有任何單個(gè)參與者有積極性選擇其他策略 也就沒有人主動(dòng)去打破這種均衡。相反如果一種均衡或制度安排,如果不是一種納什均衡.即不是所有參與者的最優(yōu)策略組合 那么,這種組合就不能成立或者至少不能持續(xù)。合作博弈強(qiáng)調(diào)團(tuán)體理性、效率和公平。而非合作博弈強(qiáng)調(diào)個(gè)人理性、個(gè)人最優(yōu)決策。其結(jié)果可能是有效的 也可能是無效的。現(xiàn)實(shí)中 大量的經(jīng)濟(jì)博弈問題是非合作博弈。非合作博弈理論的發(fā)展為其在經(jīng)濟(jì)研究中的廣泛應(yīng)用創(chuàng)造了條件并推動(dòng)了合作博弈的進(jìn)一步發(fā)展。
納什均衡假定博弈參與者在選擇自己的策略時(shí),把其他參與者的策略當(dāng)做給定的。而不考慮自己的選擇如何影響博弈對手的選擇。這個(gè)假定在靜態(tài)博弈下是成立的,但在動(dòng)態(tài)博弈下卻不成立。
在靜態(tài)博弈中,所有參與者同時(shí)行動(dòng),不可能在自己采取行動(dòng)前觀察到其他人的行動(dòng) 因而就無暇反應(yīng)。但在動(dòng)態(tài)博弈中 一方行動(dòng)在先 另一方行動(dòng)在后.后者自然會(huì)根據(jù)前者的選擇而調(diào)整自己的選擇,前者自然會(huì)理性地預(yù)期到這一點(diǎn),所以不能不考慮自己的選擇對其他參與者的影響,由于決策者不考慮自己的選擇對他人選擇的影響,納什均衡允許了不可置信威脅的存在。1965年澤爾騰(Selten) 將納什均衡的概念引入了動(dòng)態(tài)分析定義了子博弈精練納什均衡” 的概念。將不可置信的威脅策略從納什均衡中剔除出去,從而解決了完全信息動(dòng)態(tài)博弈均衡求解問題 將不可置信的策略變成可置信策略的行動(dòng) 即經(jīng)濟(jì)學(xué)中的 承諾行動(dòng)”。如果當(dāng)事人不履行其承諾時(shí)將為之付出相應(yīng)的代價(jià) 這種承諾就是可置信的,否則就是不可置信的。該概念的提出,對利用博弈論方法研究貨幣政策問題奠定了基礎(chǔ)。
二、納什均衡在貨幣政策效應(yīng)中的應(yīng)用
在理性預(yù)期條件下,我們考察一期的貨幣政策博弈均衡。假定中央銀行的目標(biāo)成本函數(shù)為:。
其中:π為通貨膨脹率;y為實(shí)際經(jīng)濟(jì)增長率;y * 為中央銀行期望的經(jīng)濟(jì)增長率。
根據(jù)盧卡斯供給曲線:y = yn + α(π ? πe),α > 0.其中:為潛在經(jīng)濟(jì)增長率;
為公眾的預(yù)期通貨膨脹率:a表示非預(yù)期通膨脹對經(jīng)濟(jì)的影響程度,即總供給曲線的斜率。
假定α=1,即:y = yn + (π ? πα)
同時(shí)假定中央銀行對貨幣增長有完全的控制能力.公眾的預(yù)期完全理性 不存在真實(shí)供給沖擊和貨幣流通速度變化的影響.通貨膨脹率π等于貨幣供給增長率m,通貨膨脹預(yù)期πα。等于貨幣供給增長率me,中央銀行期望的經(jīng)濟(jì)增長率與潛在的經(jīng)濟(jì)增長率相等。有。
令公眾的目標(biāo)函數(shù)為避免由于預(yù)期誤差導(dǎo)致的通貨膨脹之害,因此可把公眾的效用函數(shù)定義為:U = ? (m ? me)2
可得該貨幣政策博弈的支付矩陣如下:
中央銀行策略(m) | 公眾策略(me) | |
0 | 1 | |
0 | (0,0) | (0,0,5) |
1 | (1,-1) | (0,5,0) |
矩陣中m=0表示中央銀行選擇零的貨幣增長率 m=1表示中央銀行選擇正的貨幣增長率:公眾策略的含義同上。由支付矩陣可知 對中央銀行來說,m=1的效用嚴(yán)格優(yōu)于m=0的效用.m=1為其最優(yōu)策略。在理性預(yù)期下,公眾迅速認(rèn)識(shí)到中央銀行會(huì)選擇正的貨幣增長率,其必然選擇m=1以使其效用最大化,該博弈模型的納什均衡是中央銀行選擇正的貨幣增長率,公眾選擇正的通貨膨脹率預(yù)期,效用函數(shù)為(0,5,0)。均衡結(jié)果顯示貨幣政策只會(huì)影響通貨膨脹率而真實(shí)產(chǎn)出不變。
貨幣政策博弈具體表現(xiàn)為貨幣政策的決策和執(zhí)行過程中存在動(dòng)態(tài)不一致性問題。博弈主體在當(dāng)前做出的關(guān)于未來的最優(yōu)決策,在決策執(zhí)行時(shí)對決策制定者已不再是最優(yōu)決策.因而他必然要調(diào)整其決策。例如 在公眾預(yù)期形成之前 對于貨幣政策制定者來說,零通貨膨脹(或較低通貨膨脹)可能是最優(yōu)的選擇。因而為了影響公眾預(yù)期,他可能在此選擇和許諾他將實(shí)行零通貨膨脹(或較低通貨膨脹)。但是,當(dāng)公眾預(yù)期形成以后零通貨膨脹(或較低通貨膨脹)對政策制定者來說已不是最優(yōu)決策。為了獲得非預(yù)期通貨膨脹對經(jīng)濟(jì)增長和就業(yè)增加的刺激作用,政策制定者必須實(shí)行正的(或更高的)通貨膨脹.在完全信息條件下公眾知道政策制定者會(huì)這樣做.因而他的許諾是不可置信的。具有理性和完全信息的公眾不會(huì)被其愚弄.最后結(jié)果必然是被預(yù)期到的正的(或更高的)通貨膨脹。相機(jī)選擇貨幣政策的這種通貨膨脹(通貨緊縮)傾向是由該博弈結(jié)構(gòu)內(nèi)生性決定的,即該均衡(納什均衡)允許了不可置信的威脅策略的存在,中央銀行關(guān)于零通脹(或低通脹)的許諾是不可置信的。
要消除貨幣政策的通貨膨脹(通貨緊縮)傾向 必須消除這種不可置信因素——中央銀行在公眾預(yù)期形成之前承諾其將毫不改變地執(zhí)行單一規(guī)則的貨幣政策 通過承諾行動(dòng)中央銀行獲得了影響公眾預(yù)期的能力。因而,在選擇其貨幣供給增長率時(shí).就必須考慮它對公眾預(yù)期的立即和充分的影響 就不能期望制造非預(yù)期通貨膨脹(通貨緊縮)來刺激經(jīng)濟(jì)、增加就業(yè)或?yàn)轭A(yù)算融資。這就是說,提高政策的穩(wěn)定性和可信程度是消除通貨膨脹(通貨緊縮)的關(guān)鍵。