圣彼得堡悖論

1.圣彼得堡悖論概述

圣彼得堡悖論是決策論中的一個悖論。

圣彼得堡悖論是數(shù)學(xué)家丹尼爾·伯努利（Daniel Bernoulli）的表兄尼古拉·伯努利(Nicola Bernoulli)在1738提出的一個概率期望值悖論，它來自于一種擲幣游戲，即圣彼得堡游戲(表1)。設(shè)定擲出正面或者反面為成功，游戲者如果第一次投擲成功，得獎金2元，游戲結(jié)束；第一次若不成功，繼續(xù)投擲，第二次成功得獎金4元，游戲結(jié)束；這樣，游戲者如果投擲不成功就反復(fù)繼續(xù)投擲，直到成功，游戲結(jié)束。如果第n次投擲成功，得獎金 $2 n$ 元，游戲結(jié)束。按照概率期望值的計算方法，將每一個可能結(jié)果的得獎值乘以該結(jié)果發(fā)生的概率即可得到該結(jié)果獎值的期望值。游戲的期望值即為所有可能結(jié)果的期望值之和。隨著n的增大，以后的結(jié)果雖然概率很小，但是其獎值越來越大，每一個結(jié)果的期望值均為l，所有可能結(jié)果的得獎期望值之和，即游戲的期望值，將為“無窮大”。按照概率的理論，多次試驗的結(jié)果將會接近于其數(shù)學(xué)期望。但是實際的投擲結(jié)果和計算都表明，多次投擲的結(jié)果，其平均值最多也就是幾十元。正如Hacking(1980)所說：“沒有人愿意花25元去參加一次這樣的游戲?！边@就出現(xiàn)了計算的期望值與實際情況的“矛盾”，問題在哪里? 實際在游戲過程中，游戲的收費應(yīng)該是多少? 決策理論的期望值準(zhǔn)則在這里還成立嗎?這是不是給“期望值準(zhǔn)則”提出了嚴(yán)峻的挑戰(zhàn)? 正確認(rèn)識和解決這一矛盾對于人們認(rèn)識隨機現(xiàn)象、發(fā)展決策理論和指導(dǎo)實際決策無疑具有重大意義。、

圣彼得堡游戲.jpg

圣彼得堡問題對于決策工作者的啟示在于，許多悖論問題可以歸為數(shù)學(xué)問題，但它同時又是一個思維科學(xué)和哲學(xué)問題。悖論問題的實質(zhì)是人類自身思維的矛盾性。從廣義上講，悖論不僅包括人們思維成果之間的矛盾，也包括思維成果與現(xiàn)實世界的明顯的矛盾性。對于各個學(xué)科各個層次的悖論的研究，歷來是科學(xué)理論發(fā)展的動力。圣彼得堡悖論所反映的人類自身思維的矛盾性，首先具有一定的哲學(xué)研究的意義；其次它反映了決策理論和實際之間的根本差別。人們總是不自覺地把模型與實際問題進(jìn)行比較，但決策理論模型與實際問題并不是一個東西；圣彼得堡問題的理論模型是一個概率模型，它不僅是一種理論模型，而且本身就是一種統(tǒng)計的 “近似的”模型。在實際問題涉及到無窮大的時候，連這種近似也變得不可能了。

2.實驗的論文解釋

丹尼爾·伯努利對這個悖論的解答在1738年的論文里，提出了效用的概念以挑戰(zhàn)以金額期望值為決策標(biāo)準(zhǔn)，論文主要包括兩條原理：

1、邊際效用遞減原理：一個人對于財富的占有多多益善，即效用函數(shù)一階導(dǎo)數(shù)大于零；隨著財富的增加，滿足程度的增加速度不斷下降，效用函數(shù)二階導(dǎo)數(shù)小于零。

2、最大效用原理：在風(fēng)險和不確定條件下，個人的決策行為準(zhǔn)則是為了獲得最大期望效用值而非最大期望金額值。

3.圣彼得堡悖論的消解歷史

圣彼得堡悖論的提出已有200多年了，所提出的消解方法大致可以歸納為以下幾種觀點：

(一)邊際效用遞減論

Daniel Bernoulli在提出這個問題的時候就給出一種解決辦法。他認(rèn)為游戲的期望值計算不應(yīng) 該是金錢，而應(yīng)該是金錢的期望效用，即利用眾所周知的“期望效用遞減律”，將金錢的效用測度函數(shù) 用貨幣值的對數(shù)來表示:效用=log(貨幣值)，如表 2所示。所有結(jié)果的效用期望值之和將為一個有限值log(4)≈ 0.60206，如果這里的效用函數(shù)符合實際，則理性決策應(yīng)以4元為界。這一解釋其實并不能令人滿意。姑且假定“效用遞減律”是對的，金錢的效用可以用貨幣值的對數(shù)來表示。但是如果把獎金額變動一下，將獎金額提高為l0的 $2 n$ 次方(n=3時，獎金為 $108$ )，則其效用的期望值仍為無窮大，新的悖論又出現(xiàn)了當(dāng)然，我們并不清楚效用值與貨幣值之間究竟有什么樣的關(guān)系，不過只要我們按照效用的 $2 n$ 倍增加獎金，悖論就總是存在。

Image:效用遞減論的期望值.jpg

(二)風(fēng)險厭惡論

圣彼得堡悖論對于獎金額大小沒有限制，比如連續(xù)投擲40次才成功的話，獎金為1.1萬億元。但是這一獎金出現(xiàn)的概率極小，1.1萬億次才可能出現(xiàn)一次。實際上，游戲有一半的機會，其獎金為 2元，四分之三的機會得獎4元和2元。獎金越少，機會越大，獎金越大，機會越小。如果以前面 Hacking所說。花25元的費用冒險參與游戲?qū)⑹?非常愚蠢的，雖有得大獎的機會，但是風(fēng)險太大。因此，考慮采用風(fēng)險厭惡因素的方法可以消解矛盾。Pual Weirich就提出在期望值計算中加人一種風(fēng)險厭惡因子，并得出了游戲費用的有限期望值，認(rèn)為這種方法實際上解決了該悖論。

但是這種方法也并不十分完美。首先，并非所有人都是風(fēng)險厭惡的，相反有很多人喜歡冒險。如每期必買的彩票，以及Casino(卡西諾)紙牌游戲，其價格都高于得獎的期望值。你也可以說這些喜歡冒險買彩票和賭博的人是非理性的，可他們自有樂趣，喜歡這樣的風(fēng)險刺激?？傊?，風(fēng)險厭惡的觀點很難解釋清楚實際游戲平均值非常有限的問題。退一步說，即便承認(rèn)風(fēng)險厭惡的觀點，矛盾仍然不能消除。我們?nèi)匀豢梢哉{(diào)整獎金額，最后，考慮風(fēng)險厭惡情況的期望值仍然是無窮大而與實際情況不符。

(三)效用上限論

對前兩種觀點的反駁，我們采用了增加獎金額的方法來補償效用的遞減和風(fēng)險厭惡，兩者均是假定效用可以無限增加。也有一種觀點認(rèn)為獎金的效用可能有一個上限，這樣，期望效用之和就有了一個極限值。Menger認(rèn)為效用上限是惟一能消解該悖論的方法。設(shè)效用值等于貨幣值，上限為100 單位，則游戲的期望效用為7.56l25，如表3所示。也許這里的效用上限太小了，不過我們可以任意選定一個更大的值比如 $225$ 。有多人如Russell Har—din (1982)，W illiam G uNtaNon (1994)，Richard Jeffrey(1983)等都贊成這樣的觀點。不過這種效用上限的觀點似乎不太令人信服。效用上限與效用遞減不同，或許你認(rèn)為有 $225$ 的錢夠自己花的了，可是錢并不能給我們帶來所有的效用，有些東西不是錢所能買來的。效用上限意味著再也沒有價值可以添加了。但是一個人有了錢，還希望他的朋友、親戚也像他一樣富有；同一個城市里的人和他一樣富有...。而效用上限論認(rèn)為到了這一上限他們就不用再做任何交易了，看起來這并不能成立。對有些人來講，似乎期望和需求并不是無限增加的，對于現(xiàn)有的有限需求他們已經(jīng)滿足了。他們覺得這里的游戲期望效用值確實是有限的。不過是不是確實有這樣的人還是一個不確定的問題，或者是個經(jīng)驗性的問題。但認(rèn)為“越多越好”的人確實是存在的。對于決策準(zhǔn)則這樣的理性選擇的理論，不能基于可疑的和經(jīng)驗性的判斷而加以限制，因而期望有限論不足以消解這里的矛盾。

Image:效用上限論的期望值.jpg

(四)結(jié)果有限論

Gustason認(rèn)為，要避免矛盾，必須對期望值概念進(jìn)行限制，其一是限制其結(jié)果的數(shù)目；其二是把其結(jié)果值的大小限制在一定的范圍內(nèi)。這是典型的結(jié)果有限論，這一觀點是從實際出發(fā)的。因為實際上，游戲的投擲次數(shù)總是有限的數(shù)。比如對游戲設(shè)定某一個投擲的上限數(shù)L，在投擲到這個數(shù)的時候，如果仍然沒有成功，也結(jié)束游戲，不管你還能再投多少，就按照L付錢。因為你即便不設(shè)定L，實際上也總有投到頭的時候，人的壽命總是有限的，任何原因都可以使得游戲中止?，F(xiàn)在設(shè)定了上限，期望值自然也就可以計算了。

問題是，這已經(jīng)不是原來的那種游戲了!同時也并沒有證明原來的游戲期望值不是無限大。原來的游戲到底存在嗎? Jeffrey說：“任何提供這一游戲的人都是一個騙子，誰也沒有無限大的銀行!” 是說實際上沒有這種游戲嗎? 恐怕這也不見的。如果我邀請你玩這種游戲，你說我實際上不是在這樣做嗎? 或者說我實際上邀請你玩的不是這種游戲而是另外的什么游戲? 很多游戲場提供許多概率極小、獎金額極大幾乎不可能的游戲，他們?nèi)匀?在經(jīng)營、在賺錢，照樣吃飯睡覺，一點兒也不擔(dān)心哪一天會欠下一屁股債，崩盤倒閉。

Jeffrey在這樣說的時候，實際上是承認(rèn)了圣彼得堡游戲的期望值是無窮大了。認(rèn)為游戲廳不提供這樣的游戲，正是因為他們認(rèn)為其期望值是無窮大，遲早他們會因此而破產(chǎn)倒閉。這正是用了常規(guī)的決策理論，而反過來又說這種游戲?qū)嶋H上不存在，應(yīng)該排除在期望值概念之外。因此，用限制期望值概念的方法并不能消解悖論。

不能限制期望值概念的原因還有很多。比如，我們不能用限制期望值概念的方法僅把圣彼得堡游戲排除在外，而應(yīng)該是通用的。在人壽保險中，有一個險種根據(jù)保險人的年齡，每長一歲給付一定的賠付金額。采用人類壽命的經(jīng)驗曲線給出每個年齡的生存機會。大于140歲的生存率已經(jīng)沒有經(jīng) 驗可以借鑒，但可以采用一定的函數(shù)將生存年齡擴展至無窮大，當(dāng)然其生存率趨向于零。注意到這里的給付金額也是無限的，但是其在期望值計算方面并沒有出現(xiàn)什么問題。

4.對決策理論與現(xiàn)實的啟示

雖然圣彼得堡游戲問題只是一個具體問題，但是類似的實際決策問題是存在的。它們起碼是可觀察的，其觀察值確實也是存在的。而且它確實也給決策的期望值準(zhǔn)則提出了挑戰(zhàn)，所提出的問題需要我們給予解答。通過上述問題的消解，我們至少可以給出下列有關(guān)問題的答案和啟示。

首先，理論上應(yīng)該承認(rèn)圣彼得堡游戲的“數(shù)學(xué) 期望”是無窮大的。但理論與實際是有差別的，在涉及無窮大決策問題的時候，必須注意這種差別。

其次，實際試驗中隨著游戲試驗次數(shù)的增加，其均值將會越來越大，并與實驗次數(shù)呈對數(shù)關(guān)系，即樣本均值= $l o g 2$ (實驗次數(shù))=log(實驗次數(shù))/log2。

再次，實際問題的解決還是要根據(jù)具體問題進(jìn) 行具體分析。前面的圣彼得堡悖論消解方法都是很實用的方法。也--I以設(shè)計其他方法，比如可以運用“實際推斷原理”，根據(jù)實驗次數(shù)n設(shè)定一個相應(yīng) 的“小概率”，對于圣彼得堡問題來講，是一個很實際的方法；或者建立一個近似模型，比如確定一個最大可能成功的投擲次數(shù)n，將投擲n+1次以后的概率設(shè)為 $1 / 2 k$ ，仍然符合概率分布的條件(所有結(jié)果的概率之和等于1)等等。

最后，圣彼得堡問題對于決策工作者的啟示在于，許多悖論問題可以歸為數(shù)學(xué)問題，但它同時又是一個思維科學(xué)和哲學(xué)問題。悖論問題的實質(zhì)是人類自身思維的矛盾性。從廣義上講，悖論不僅包括人們思維成果之間的矛盾，也包括思維成果與現(xiàn) 實世界的明顯的矛盾性。對于各個學(xué)科各個層次的悖論的研究，歷來是科學(xué)理論發(fā)展的動力。圣彼得堡悖論所反映的人類自身思維的矛盾性，首先具有一定的哲學(xué)研究的意義；其次它反映了決策理論和實際之間的根本差別。人們總是不自覺地把模型與實際問題進(jìn)行比較，但決策理論模型與實際問題并不是一個東西；圣彼得堡問題的理論模型是一個概率模型，它不僅是一種理論模型，而且本身就是一種統(tǒng)計的 “近似的”模型。在實際問題涉及到無窮大的時候，連這種近似也變得不可能了。

決策科學(xué)是一門應(yīng)用學(xué)科，它的研究需要自然科學(xué)和社會科學(xué)的各種基礎(chǔ)理論和方法，包括數(shù)學(xué) 方法。這些方法都具有很強的理論性和高度抽象性。但是，決策科學(xué)更是一門應(yīng)用性、實踐性很強的學(xué)科，要求決策理論與決策實踐緊密結(jié)合。因此，我們在決策理論的研究和解決實際問題的時候，應(yīng)高度重視理論和實踐的關(guān)系。理論模型的建立，既要源于實踐，又不能囿于實踐，發(fā)揮主觀創(chuàng)造力，才能有所突破，有所建立。

評論 | 0條評論

評論

經(jīng)理人分享

圣彼得堡悖論

目錄

1.圣彼得堡悖論概述

2.實驗的論文解釋

3.圣彼得堡悖論的消解歷史

4.對決策理論與現(xiàn)實的啟示