圣彼得堡悖論
1.圣彼得堡悖論概述
圣彼得堡悖論是決策論中的一個(gè)悖論。
圣彼得堡悖論是數(shù)學(xué)家丹尼爾·伯努利(Daniel Bernoulli)的表兄尼古拉·伯努利(Nicola Bernoulli)在1738提出的一個(gè)概率期望值悖論,它來(lái)自于一種擲幣游戲,即圣彼得堡游戲(表1)。設(shè)定擲出正面或者反面為成功,游戲者如果第一次投擲成功,得獎(jiǎng)金2元,游戲結(jié)束;第一次若不成功,繼續(xù)投擲,第二次成功得獎(jiǎng)金4元,游戲結(jié)束;這樣,游戲者如果投擲不成功就反復(fù)繼續(xù)投擲,直到成功,游戲結(jié)束。如果第n次投擲成功,得獎(jiǎng)金2n元,游戲結(jié)束。按照概率期望值的計(jì)算方法,將每一個(gè)可能結(jié)果的得獎(jiǎng)值乘以該結(jié)果發(fā)生的概率即可得到該結(jié)果獎(jiǎng)值的期望值。游戲的期望值即為所有可能結(jié)果的期望值之和。隨著n的增大,以后的結(jié)果雖然概率很小,但是其獎(jiǎng)值越來(lái)越大,每一個(gè)結(jié)果的期望值均為l,所有可能結(jié)果的得獎(jiǎng)期望值之和,即游戲的期望值,將為“無(wú)窮大”。按照概率的理論,多次試驗(yàn)的結(jié)果將會(huì)接近于其數(shù)學(xué)期望。但是實(shí)際的投擲結(jié)果和計(jì)算都表明,多次投擲的結(jié)果,其平均值最多也就是幾十元。正如Hacking(1980)所說(shuō):“沒(méi)有人愿意花25元去參加一次這樣的游戲?!边@就出現(xiàn)了計(jì)算的期望值與實(shí)際情況的“矛盾”,問(wèn)題在哪里? 實(shí)際在游戲過(guò)程中,游戲的收費(fèi)應(yīng)該是多少? 決策理論的期望值準(zhǔn)則在這里還成立嗎?這是不是給“期望值準(zhǔn)則”提出了嚴(yán)峻的挑戰(zhàn)? 正確認(rèn)識(shí)和解決這一矛盾對(duì)于人們認(rèn)識(shí)隨機(jī)現(xiàn)象、發(fā)展決策理論和指導(dǎo)實(shí)際決策無(wú)疑具有重大意義。、
圣彼得堡問(wèn)題對(duì)于決策工作者的啟示在于,許多悖論問(wèn)題可以歸為數(shù)學(xué)問(wèn)題,但它同時(shí)又是一個(gè)思維科學(xué)和哲學(xué)問(wèn)題。悖論問(wèn)題的實(shí)質(zhì)是人類(lèi)自身思維的矛盾性。從廣義上講,悖論不僅包括人們思維成果之間的矛盾,也包括思維成果與現(xiàn)實(shí)世界的明顯的矛盾性。對(duì)于各個(gè)學(xué)科各個(gè)層次的悖論的研究,歷來(lái)是科學(xué)理論發(fā)展的動(dòng)力。圣彼得堡悖論所反映的人類(lèi)自身思維的矛盾性,首先具有一定的哲學(xué)研究的意義;其次它反映了決策理論和實(shí)際之間的根本差別。人們總是不自覺(jué)地把模型與實(shí)際問(wèn)題進(jìn)行比較,但決策理論模型與實(shí)際問(wèn)題并不是一個(gè)東西;圣彼得堡問(wèn)題的理論模型是一個(gè)概率模型,它不僅是一種理論模型,而且本身就是一種統(tǒng)計(jì)的 “近似的”模型。在實(shí)際問(wèn)題涉及到無(wú)窮大的時(shí)候,連這種近似也變得不可能了。
2.實(shí)驗(yàn)的論文解釋
丹尼爾·伯努利對(duì)這個(gè)悖論的解答在1738年的論文里,提出了效用的概念以挑戰(zhàn)以金額期望值為決策標(biāo)準(zhǔn),論文主要包括兩條原理:
1、邊際效用遞減原理:一個(gè)人對(duì)于財(cái)富的占有多多益善,即效用函數(shù)一階導(dǎo)數(shù)大于零;隨著財(cái)富的增加,滿(mǎn)足程度的增加速度不斷下降,效用函數(shù)二階導(dǎo)數(shù)小于零。
2、最大效用原理:在風(fēng)險(xiǎn)和不確定條件下,個(gè)人的決策行為準(zhǔn)則是為了獲得最大期望效用值而非最大期望金額值。
3.圣彼得堡悖論的消解歷史
圣彼得堡悖論的提出已有200多年了,所提出的消解方法大致可以歸納為以下幾種觀點(diǎn):
(一)邊際效用遞減論
Daniel Bernoulli在提出這個(gè)問(wèn)題的時(shí)候就給 出一種解決辦法。他認(rèn)為游戲的期望值計(jì)算不應(yīng) 該是金錢(qián),而應(yīng)該是金錢(qián)的期望效用,即利用眾所 周知的“期望效用遞減律”,將金錢(qián)的效用測(cè)度函數(shù) 用貨幣值的對(duì)數(shù)來(lái)表示:效用=log(貨幣值),如表 2所示。所有結(jié)果的效用期望值之和將為一個(gè)有 限值log(4)≈ 0.60206,如果這里的效用函數(shù)符合 實(shí)際,則理性決策應(yīng)以4元為界。這一解釋其實(shí)并 不能令人滿(mǎn)意。姑且假定“效用遞減律”是對(duì)的,金 錢(qián)的效用可以用貨幣值的對(duì)數(shù)來(lái)表示。但是如果 把獎(jiǎng)金額變動(dòng)一下,將獎(jiǎng)金額提高為l0的2n次方(n=3時(shí),獎(jiǎng)金為108),則其效用的期望值仍為無(wú) 窮大,新的悖論又出現(xiàn)了 當(dāng)然,我們并不清楚效 用值與貨幣值之間究竟有什么樣的關(guān)系,不過(guò)只要 我們按照效用的2n倍增加獎(jiǎng)金,悖論就總是存在。
(二)風(fēng)險(xiǎn)厭惡論
圣彼得堡悖論對(duì)于獎(jiǎng)金額大小沒(méi)有限制,比如 連續(xù)投擲40次才成功的話(huà),獎(jiǎng)金為1.1萬(wàn)億元。 但是這一獎(jiǎng)金出現(xiàn)的概率極小,1.1萬(wàn)億次才可能 出現(xiàn)一次。實(shí)際上,游戲有一半的機(jī)會(huì),其獎(jiǎng)金為 2元,四分之三的機(jī)會(huì)得獎(jiǎng)4元和2元。獎(jiǎng)金越 少,機(jī)會(huì)越大,獎(jiǎng)金越大,機(jī)會(huì)越小。如果以前面 Hacking所說(shuō)?;?5元的費(fèi)用冒險(xiǎn)參與游戲?qū)⑹?非常愚蠢的,雖有得大獎(jiǎng)的機(jī)會(huì),但是風(fēng)險(xiǎn)太大。 因此,考慮采用風(fēng)險(xiǎn)厭惡因素的方法可以消解矛 盾。Pual Weirich就提出在期望值計(jì)算中加人一種 風(fēng)險(xiǎn)厭惡因子,并得出了游戲費(fèi)用的有限期望 值,認(rèn)為這種方法實(shí)際上解決了該悖論。
但是這種方法也并不十分完美。首先,并非所 有人都是風(fēng)險(xiǎn)厭惡的,相反有很多人喜歡冒險(xiǎn)。如 每期必買(mǎi)的彩票,以及Casino(卡西諾)紙牌游戲, 其價(jià)格都高于得獎(jiǎng)的期望值。你也可以說(shuō)這些喜 歡冒險(xiǎn)買(mǎi)彩票和賭博的人是非理性的,可他們自有 樂(lè)趣,喜歡這樣的風(fēng)險(xiǎn)刺激??傊?,風(fēng)險(xiǎn)厭惡的觀 點(diǎn)很難解釋清楚實(shí)際游戲平均值非常有限的問(wèn)題。退一步說(shuō),即便承認(rèn)風(fēng)險(xiǎn)厭惡的觀點(diǎn),矛盾仍 然不能消除。我們?nèi)匀豢梢哉{(diào)整獎(jiǎng)金額,最后,考 慮風(fēng)險(xiǎn)厭惡情況的期望值仍然是無(wú)窮大而與實(shí)際 情況不符。
(三)效用上限論
對(duì)前兩種觀點(diǎn)的反駁,我們采用了增加獎(jiǎng)金額 的方法來(lái)補(bǔ)償效用的遞減和風(fēng)險(xiǎn)厭惡,兩者均是假 定效用可以無(wú)限增加。也有一種觀點(diǎn)認(rèn)為獎(jiǎng)金的 效用可能有一個(gè)上限,這樣,期望效用之和就有了 一個(gè)極限值。Menger認(rèn)為效用上限是惟一能消解 該悖論的方法。設(shè)效用值等于貨幣值,上限為100 單位,則游戲的期望效用為7.56l25,如表3所示。 也許這里的效用上限太小了,不過(guò)我們可以任意選 定一個(gè)更大的值比如225 。有多人如Russell Har—din (1982),W illiam G uNtaNon (1994),Richard Jeffrey(1983)等都贊成這樣的觀點(diǎn)。不過(guò)這 種效用上限的觀點(diǎn)似乎不太令人信服。效用上限 與效用遞減不同,或許你認(rèn)為有225 的錢(qián)夠自己花的了,可是錢(qián)并不能給我們帶來(lái)所有的效用,有些 東西不是錢(qián)所能買(mǎi)來(lái)的。效用上限意味著再也沒(méi) 有價(jià)值可以添加了。但是一個(gè)人有了錢(qián),還希望他 的朋友、親戚也像他一樣富有;同一個(gè)城市里的人 和他一樣富有...。而效用上限論認(rèn)為到了這一 上限他們就不用再做任何交易了,看起來(lái)這并不能 成立。對(duì)有些人來(lái)講,似乎期望和需求并不是無(wú)限 增加的,對(duì)于現(xiàn)有的有限需求他們已經(jīng)滿(mǎn)足了。他 們覺(jué)得這里的游戲期望效用值確實(shí)是有限的。不 過(guò)是不是確實(shí)有這樣的人還是一個(gè)不確定的問(wèn)題, 或者是個(gè)經(jīng)驗(yàn)性的問(wèn)題。但認(rèn)為“越多越好”的人 確實(shí)是存在的。對(duì)于決策準(zhǔn)則這樣的理性選擇的 理論,不能基于可疑的和經(jīng)驗(yàn)性的判斷而加以限 制,因而期望有限論不足以消解這里的矛盾。
(四)結(jié)果有限論
Gustason認(rèn)為,要避免矛盾,必須對(duì)期望值概 念進(jìn)行限制,其一是限制其結(jié)果的數(shù)目;其二是把 其結(jié)果值的大小限制在一定的范圍內(nèi)。這是典型 的結(jié)果有限論,這一觀點(diǎn)是從實(shí)際出發(fā)的。因?yàn)閷?shí) 際上,游戲的投擲次數(shù)總是有限的數(shù)。比如對(duì)游戲 設(shè)定某一個(gè)投擲的上限數(shù)L,在投擲到這個(gè)數(shù)的時(shí) 候,如果仍然沒(méi)有成功,也結(jié)束游戲,不管你還能再投多少,就按照L付錢(qián)。因?yàn)槟慵幢悴辉O(shè)定L,實(shí) 際上也總有投到頭的時(shí)候,人的壽命總是有限的, 任何原因都可以使得游戲中止。現(xiàn)在設(shè)定了上限, 期望值自然也就可以計(jì)算了。
問(wèn)題是,這已經(jīng)不是原來(lái)的那種游戲了!同時(shí) 也并沒(méi)有證明原來(lái)的游戲期望值不是無(wú)限大。原 來(lái)的游戲到底存在嗎? Jeffrey說(shuō):“任何提供這一 游戲的人都是一個(gè)騙子,誰(shuí)也沒(méi)有無(wú)限大的銀行!” 是說(shuō)實(shí)際上沒(méi)有這種游戲嗎? 恐怕這也不見(jiàn)的。 如果我邀請(qǐng)你玩這種游戲,你說(shuō)我實(shí)際上不是在這 樣做嗎? 或者說(shuō)我實(shí)際上邀請(qǐng)你玩的不是這種游 戲而是另外的什么游戲? 很多游戲場(chǎng)提供許多概 率極小、獎(jiǎng)金額極大幾乎不可能的游戲,他們?nèi)匀?在經(jīng)營(yíng)、在賺錢(qián),照樣吃飯睡覺(jué),一點(diǎn)兒也不擔(dān)心哪 一天會(huì)欠下一屁股債,崩盤(pán)倒閉。
Jeffrey在這樣說(shuō)的時(shí)候,實(shí)際上是承認(rèn)了圣 彼得堡游戲的期望值是無(wú)窮大了。認(rèn)為游戲廳不 提供這樣的游戲,正是因?yàn)樗麄冋J(rèn)為其期望值是無(wú) 窮大,遲早他們會(huì)因此而破產(chǎn)倒閉。這正是用了常 規(guī)的決策理論,而反過(guò)來(lái)又說(shuō)這種游戲?qū)嶋H上不存 在,應(yīng)該排除在期望值概念之外。因此,用限制期 望值概念的方法并不能消解悖論。
不能限制期望值概念的原因還有很多。比如, 我們不能用限制期望值概念的方法僅把圣彼得堡 游戲排除在外,而應(yīng)該是通用的。在人壽保險(xiǎn)中, 有一個(gè)險(xiǎn)種根據(jù)保險(xiǎn)人的年齡,每長(zhǎng)一歲給付一定 的賠付金額。采用人類(lèi)壽命的經(jīng)驗(yàn)曲線(xiàn)給出每個(gè) 年齡的生存機(jī)會(huì)。大于140歲的生存率已經(jīng)沒(méi)有經(jīng) 驗(yàn)可以借鑒,但可以采用一定的函數(shù)將生存年齡擴(kuò) 展至無(wú)窮大,當(dāng)然其生存率趨向于零。注意到這里 的給付金額也是無(wú)限的,但是其在期望值計(jì)算方面 并沒(méi)有出現(xiàn)什么問(wèn)題。
4.對(duì)決策理論與現(xiàn)實(shí)的啟示
雖然圣彼得堡游戲問(wèn)題只是一個(gè)具體問(wèn)題,但 是類(lèi)似的實(shí)際決策問(wèn)題是存在的。它們起碼是可 觀察的,其觀察值確實(shí)也是存在的。而且它確實(shí)也 給決策的期望值準(zhǔn)則提出了挑戰(zhàn),所提出的問(wèn)題需 要我們給予解答。通過(guò)上述問(wèn)題的消解,我們至少 可以給出下列有關(guān)問(wèn)題的答案和啟示。
首先,理論上應(yīng)該承認(rèn)圣彼得堡游戲的“數(shù)學(xué) 期望”是無(wú)窮大的。但理論與實(shí)際是有差別的,在 涉及無(wú)窮大決策問(wèn)題的時(shí)候,必須注意這種差別。
其次,實(shí)際試驗(yàn)中隨著游戲試驗(yàn)次數(shù)的增加, 其均值將會(huì)越來(lái)越大,并與實(shí)驗(yàn)次數(shù)呈對(duì)數(shù)關(guān)系, 即樣本均值=log2(實(shí)驗(yàn)次數(shù))=log(實(shí)驗(yàn)次數(shù))/log2。
再次,實(shí)際問(wèn)題的解決還是要根據(jù)具體問(wèn)題進(jìn) 行具體分析。前面的圣彼得堡悖論消解方法都是 很實(shí)用的方法。也--I以設(shè)計(jì)其他方法,比如可以運(yùn) 用“實(shí)際推斷原理”,根據(jù)實(shí)驗(yàn)次數(shù)n設(shè)定一個(gè)相應(yīng) 的“小概率”,對(duì)于圣彼得堡問(wèn)題來(lái)講,是一個(gè)很實(shí) 際的方法;或者建立一個(gè)近似模型,比如確定一個(gè) 最大可能成功的投擲次數(shù)n,將投擲n+1次以后 的概率設(shè)為1 / 2k,仍然符合概率分布的條件(所有結(jié)果的概率之和等于1)等等。
最后,圣彼得堡問(wèn)題對(duì)于決策工作者的啟示在 于,許多悖論問(wèn)題可以歸為數(shù)學(xué)問(wèn)題,但它同時(shí)又 是一個(gè)思維科學(xué)和哲學(xué)問(wèn)題。悖論問(wèn)題的實(shí)質(zhì)是 人類(lèi)自身思維的矛盾性。從廣義上講,悖論不僅包 括人們思維成果之間的矛盾,也包括思維成果與現(xiàn) 實(shí)世界的明顯的矛盾性。對(duì)于各個(gè)學(xué)科各個(gè)層次 的悖論的研究,歷來(lái)是科學(xué)理論發(fā)展的動(dòng)力。圣彼 得堡悖論所反映的人類(lèi)自身思維的矛盾性,首先具 有一定的哲學(xué)研究的意義;其次它反映了決策理論 和實(shí)際之間的根本差別。人們總是不自覺(jué)地把模 型與實(shí)際問(wèn)題進(jìn)行比較,但決策理論模型與實(shí)際問(wèn) 題并不是一個(gè)東西;圣彼得堡問(wèn)題的理論模型是 一個(gè)概率模型,它不僅是一種理論模型,而且本 身就是一種統(tǒng)計(jì)的 “近似的”模型。在實(shí)際問(wèn) 題涉及到無(wú)窮大的時(shí)候,連這種近似也變得不可能了。
決策科學(xué)是一門(mén)應(yīng)用學(xué)科,它的研究需要自然 科學(xué)和社會(huì)科學(xué)的各種基礎(chǔ)理論和方法,包括數(shù)學(xué) 方法。這些方法都具有很強(qiáng)的理論性和高度抽象 性。但是,決策科學(xué)更是一門(mén)應(yīng)用性、實(shí)踐性很強(qiáng) 的學(xué)科,要求決策理論與決策實(shí)踐緊密結(jié)合。因 此,我們?cè)跊Q策理論的研究和解決實(shí)際問(wèn)題的時(shí) 候,應(yīng)高度重視理論和實(shí)踐的關(guān)系。理論模型的建 立,既要源于實(shí)踐,又不能囿于實(shí)踐,發(fā)揮主觀創(chuàng)造 力,才能有所突破,有所建立。