登錄

博弈邏輯

百科 > 博弈論 > 博弈邏輯

1.什么是博弈邏輯

博弈論研究人類活動(dòng)中的互動(dòng)行為,在經(jīng)濟(jì)學(xué)中得到廣泛的運(yùn)用。在博弈論中,人類的所有活動(dòng),只要是互動(dòng)行為,均可以看成是博弈行動(dòng)。在此基礎(chǔ)上,一種新的邏輯“博弈邏輯”(game logic)得以興起,它是一種特殊的行動(dòng)邏輯(action logic)。

“博弈邏輯” 英文為“game logic”?!癵ame”的基本意義是游戲。日常生活中的打牌、下棋、猜謎以及各種體育比賽都是不同種類、不同形式的游戲。很多游戲有一個(gè)共同的特點(diǎn),即策略在其中起著很大的作用。因此,有些學(xué)者也把“game”譯做“對策”,相應(yīng)的“game logic” 譯為“對策邏輯”。[1]

博弈邏輯是研究“理性的”行動(dòng)者或參與者在互動(dòng)的過程中如何選擇策略或如何做出行動(dòng)的邏輯。博弈邏輯有兩個(gè)基本假定:第一,博弈參與者是理性的,即參與者努力使自己的得益最大化;第二,博弈參與者的利益不僅取決于自己的行動(dòng),同時(shí)取決于他人的行動(dòng)。[1]

可見,構(gòu)成一個(gè)博弈需包含以下幾個(gè)要素[1]

1、博弈的參與者players。博弈中的每個(gè)獨(dú)立參與者可稱為一個(gè)“博弈方”。博弈方可以是個(gè)人,也可以是決策團(tuán)體。有時(shí)自然也可以成為博弈方。比如,在風(fēng)險(xiǎn)型博弈和不確定型博弈的一人博弈中,自然就是一個(gè)博弈方。

2、博弈方各自可選擇的全部策略Strategies或行為Actions的集合。一個(gè)策略是一套完整的行動(dòng)方案,它事先確定一個(gè)博弈方在對局過程中出現(xiàn)的一切可能情況下采取什么方法或做法。在不同的博弈中可供博弈方選擇的策略或行為的數(shù)量很不相同,即使在同一博弈中不同博弈方可選策略或行為也常不同,有時(shí)只有有限的幾種,而有時(shí)又有可能有許多種,甚至無限多種。

3、博弈方的得益Payoff。對應(yīng)于各博弈方的每一組可能的決策選擇,博弈都有一個(gè)結(jié)果表示各博弈方在該策略下的所得和所失。博弈中的這些可能結(jié)果的量化數(shù)值,稱為各博弈方在相應(yīng)情況下的“得益”。規(guī)定一個(gè)博弈必須對得益做出規(guī)定,得益可以是正值,也可以是負(fù)值,它們是分析博弈模型的標(biāo)準(zhǔn)和基礎(chǔ)。

通過上述方法定義了各種博弈行為,由此也就確定了博弈邏輯的研究對象。

2.博弈邏輯的基本內(nèi)容[1]

在博弈邏輯中,依據(jù)博弈方數(shù)量的不同,可以對其進(jìn)行不同的劃分。學(xué)術(shù)界目前有兩種不同的觀點(diǎn)。大多數(shù)學(xué)者的觀點(diǎn)是將其劃分為二人博弈邏輯和多人博弈邏輯;還有一些學(xué)者,將一人博弈邏輯也納入進(jìn)來。按照他們的觀點(diǎn),博弈邏輯可劃分為一人博弈邏輯、二人博弈邏輯和多人博弈邏輯。本文對這兩種觀點(diǎn)持有異議,認(rèn)為一人博弈邏輯中的風(fēng)險(xiǎn)型個(gè)人博弈邏輯和不確定型個(gè)人博弈邏輯可以納入進(jìn)來,而不應(yīng)當(dāng)包括確定型個(gè)人博弈邏輯。理由如下:

第一,博弈邏輯中至少應(yīng)存在兩個(gè)獨(dú)立的博弈參與者(博弈方)。

第二,在“風(fēng)險(xiǎn)型個(gè)人博弈”和“不確定型個(gè)人博弈”中,我們可以把自然看作是與個(gè)人相對的另一個(gè)博弈方,可看作是“一人對自然的博弈”。在這兩類博弈中,結(jié)果受到自然的影響,個(gè)人不能完全支配結(jié)果,因?yàn)樗倪x擇并不導(dǎo)致能夠確定預(yù)測的結(jié)果。這兩類博弈的結(jié)果部分地取決于個(gè)人的選擇,部分地依賴于一個(gè)虛構(gòu)的博弈方(自然)的選擇,當(dāng)然,自然的選擇不是自覺的、有意識的。有了自然這個(gè)虛構(gòu)的博弈方,一人對自然的博弈就可以納入博弈邏輯分析的范圍了。

第三,有些學(xué)者提出的“確定型個(gè)人博弈”,其特點(diǎn)是個(gè)人完全支配著行動(dòng)的結(jié)果。而且他的每一行動(dòng)的結(jié)果既不受他人的干預(yù),也不受自然的影響。它是一種完全沒有對手的局面——沒有選擇的相互依賴性,因此不是博弈邏輯所研究的范圍。

由此,認(rèn)為博弈邏輯包含以下幾方面的內(nèi)容:

1、一人博弈邏輯。一人博弈邏輯即以個(gè)人和自然分別為博弈方的邏輯,包括風(fēng)險(xiǎn)型個(gè)人博弈邏輯和不確定型個(gè)人博弈邏輯。風(fēng)險(xiǎn)型個(gè)人博弈邏輯中,決策者本人要同自然做斗爭,他不能確切地知道會出現(xiàn)哪一種可能的自然狀態(tài),但是能夠有意義地給自然狀態(tài)分配概率,即能夠確定或推算每一可能狀態(tài)的頻率。比如,抽獎(jiǎng)就是一個(gè)典型例子,根據(jù)獎(jiǎng)券總數(shù)和得獎(jiǎng)數(shù),可以推算出一張獎(jiǎng)券得獎(jiǎng)的概率。而在不確定型個(gè)人博弈邏輯中,可能結(jié)果的概率估計(jì)沒有足夠的統(tǒng)計(jì)數(shù)據(jù)或頻率可以依據(jù),因此很難給自然狀態(tài)分配概率。比如一個(gè)病人患了疑難病癥,醫(yī)生要在幾種治療方案中選擇一種,而這種治療方法能治好他疾病的概率是很難計(jì)算的。一人博弈邏輯是博弈邏輯的基礎(chǔ)。

2、二人博弈邏輯。二人博弈邏輯就是兩個(gè)各自獨(dú)立決策,但策略和利益具有相互依存關(guān)系的博弈方如何合理選擇策略的邏輯。根據(jù)博弈中的得益情況,二人博弈邏輯又可分為二人零和博弈邏輯和二人變和博弈邏輯。二人零和博弈邏輯研究的是博弈雙方得益之和等于零的情況,在這種博弈中,博弈方的利益是完全相反的,沒有任何調(diào)和的余地。而在二人變和博弈邏輯中,博弈方的利益不是完全相反的,而是部分一致部分矛盾的,這兩個(gè)博弈方在不同策略組合下各博弈方的利益之和往往是不同的。

3、多人博弈邏輯。多人博弈邏輯也是博弈方在意識到其他博弈方的存在,意識到其他博弈方對自己決策的反應(yīng)和反作用存在的情況下,為尋求自身最大利益而采取行動(dòng)的邏輯。多人博弈邏輯有三個(gè)或三個(gè)以上的博弈方。根據(jù)博弈的規(guī)則,多人博弈邏輯可分為合作博弈邏輯和非合作博弈邏輯兩類。

此外,學(xué)術(shù)界中對博弈邏輯還有其他的分類,如根據(jù)信息結(jié)構(gòu)分為完全信息博弈邏輯和不完全信息博弈邏輯;根據(jù)博弈過程可分為靜態(tài)博弈動(dòng)態(tài)博弈。這些分類都是很有意義的,可以從不同方面、不同角度切入,從而對博弈邏輯進(jìn)行更深入的探討和研究。

3.博弈邏輯的主要理論

博弈論研究多個(gè)理性人在互動(dòng)過程中如何選擇自己的策略。理性的人是使自己的目標(biāo)或得益最大化的人,在經(jīng)濟(jì)活動(dòng)中理性的人即是使經(jīng)濟(jì)目標(biāo)最大化的人——經(jīng)濟(jì)人。理性人如何使得自己的“得益”最大?關(guān)鍵是“推理”。

博弈邏輯中存在著兩種研究綱領(lǐng)。第一種研究綱領(lǐng)是結(jié)合模態(tài)邏輯系統(tǒng),建立新的博弈邏輯系統(tǒng)。在這方面,日本筑波大學(xué)的金子守(Mamoru Kaneko)教授是這方面的權(quán)威。近幾年,他在國際刊物上發(fā)表了大量有關(guān)博弈邏輯方面的論文。他不僅在模態(tài)邏輯系統(tǒng)的基礎(chǔ)上建立了多個(gè)博弈邏輯 (game logic)系統(tǒng),而且,建立了與博弈邏輯密切相關(guān)的公共知識邏輯(common knowledge logic)系統(tǒng)。第二種研究綱領(lǐng)是研究博弈活動(dòng)中的實(shí)際“推理問題”,許多博弈論專家在此方面做了大量的工作。

根據(jù)博弈論,人們在實(shí)際的博弈活動(dòng)中涉及到兩種推理:演繹推理與歸納推理。然而,正如傳統(tǒng)邏輯中存在著悖論(演繹悖論和歸納悖論),在博弈邏輯中同樣存在著悖論。

4.博弈邏輯的例子

一個(gè)分蛋糕的例子:n個(gè)人分一塊大蛋糕,每個(gè)人都希望能最大化自己的所得,那么怎么分才公平呢?(這里的公平是指每個(gè)人都認(rèn)為自己可以使自己分得的那部分不少于1/n。)

如果n=2,可以使用歷史悠久的“我分你選”算法,可以實(shí)行公平的分配。當(dāng)n>=3時(shí),有幾種可能的分法。我們討論一種“修整法”:當(dāng)?shù)谝粋€(gè)人切下一塊“屬于”他的蛋糕時(shí),這塊蛋糕必須由其他n–1個(gè)人進(jìn)行審查,在審查過程中,如果有人覺得這塊蛋糕太大,可以對它進(jìn)行修整,切下的那些放回原處。蛋糕被輪流檢查過以后,如果這n-1個(gè)人當(dāng)中沒有任何人修整它,這塊蛋糕就屬于第一個(gè)人,如果至少有一個(gè)人對它進(jìn)行了修整,那么這塊蛋糕就屬于最后一個(gè)修整它的人。這種算法能保證蛋糕的公平分配,我們可以通過博弈邏輯這一工具對此加以證明。

評論  |   0條評論