個(gè)人概率
1.個(gè)人概率簡介
個(gè)人概率的意思自從17世紀(jì)貝努里一開始研究概率時(shí)就已經(jīng)產(chǎn)生了。實(shí)際上,概率(probability)這個(gè)英文字創(chuàng)造的初衷,就是用來處理主觀不確定性 的。
L·J·薩維奇和布魯諾·德費(fèi)奈蒂在20世紀(jì)60年代和70年代,推導(dǎo)出了個(gè)人概率背后的許多數(shù)學(xué)模式。在20世紀(jì)60年代末期在北卡羅來納大學(xué)舉辦了一場統(tǒng)計(jì)學(xué)會(huì)議,會(huì) 上薩維奇在演講中曾闡述他的一部分想法。薩維奇認(rèn)為,世界上并沒有“已被證明的科學(xué)事實(shí)”這樣的事情。有的只是一些陳述,而那些自認(rèn)為是科學(xué)家的人對這些陳述持有很高的贊成概率。他舉例說,在場聽他演講的人對“地球是圓的”這項(xiàng)陳述一定持有很高的認(rèn)同概率,但若我們有機(jī)會(huì)對全世界的人做一次普查,則我們很可能發(fā)現(xiàn)在中國中部的許多農(nóng)民對上述陳述持有很低的概率。講到這里的時(shí)候,薩維奇不得不被迫停下來,因?yàn)樾@里一群學(xué)生正在會(huì)堂外游行通過。他們還高喊著口號(hào)“停止上課!罷課!罷課!停止上課!”這些學(xué)生在要求全校的學(xué)生罷課,以抗議越南戰(zhàn)爭。等到他們走,四周又恢復(fù)平靜,薩維奇才看看窗外,然后說:“看來,我們可能是認(rèn)為地球是圓的人中的最后一代?!?
個(gè)人概率有許多不同的版本。其中一個(gè)極端是薩維奇-德費(fèi)奈蒂的方法,該方法認(rèn)為每個(gè)人都有其自己獨(dú)特的一套概率。而另一個(gè)極端則是凱恩斯的觀點(diǎn),他認(rèn)為概率是一種信仰程度(the degree of belief),這種信仰是一個(gè)在特定的文化環(huán)境中一個(gè)有教養(yǎng)的人可能期望持有的信念。按照凱恩斯的觀點(diǎn),一個(gè)特定文化環(huán)境中的所有人(薩維奇所說的科學(xué)家或中國中部的農(nóng)民)對某一特定的陳述,會(huì)持有一個(gè)一般的概率水平。由于這個(gè)概率水平取決于文化和時(shí)間,因此從某種絕對的意義上為說,很有可能這個(gè)適當(dāng)?shù)母怕仕绞清e(cuò)的。
薩維奇和德費(fèi)奈蒂則主張每個(gè)人都有自己特定的一套個(gè)人概率,他們還描述怎樣運(yùn)用一種叫做“標(biāo)準(zhǔn)賭博”(standard gamble)的技巧把這種個(gè)人概率求出來。為了讓整個(gè)文化中的人能共享既定的一套概率,凱恩斯不得不弱化相關(guān)的數(shù)學(xué)定義,概率不再是一個(gè)精確的數(shù)字(例如67%),而是一種將想法排序的方法(例如,明天可能下雨的概率大于 可能下雪的概率)。
2.貝葉斯定理與個(gè)人概率[1]
不管個(gè)人概率的概念是如何被準(zhǔn)確定義的,貝葉斯定理在個(gè)人概率中的應(yīng)用方式,看上去與大多數(shù)的想法相吻合。貝葉斯方法一開始是假設(shè)在一個(gè)人的頭腦中有一組先驗(yàn)概率(a prior set of probabilities),接下來這個(gè)人經(jīng)過觀測或?qū)嶒?yàn)產(chǎn)生了數(shù)據(jù),然后再拿這組數(shù)據(jù)來修正先驗(yàn)概率(prior probability),生成一組后驗(yàn)概率(a posterior set of probabilities):
先驗(yàn)概率 → 數(shù)據(jù) → 后驗(yàn)概率
假設(shè)這個(gè)人想確定是否所有的大烏鴉都是黑的。她首先存有一些關(guān)于“這個(gè)陳述是真的”概率的先驗(yàn)知識(shí)。例如,起初她可能對大烏鴉一無所知,對“所有大烏鴉都是黑的”這句話半信半疑,相信比例是50:50。數(shù)據(jù)則包括她對大烏鴉的觀測。假如她看到了一只大烏鴉,而且這只大烏鴉是黑色的,她的后驗(yàn)概率就會(huì)增加。因此下一次她再觀測大烏鴉時(shí),她的新的先驗(yàn)概率(也就是上一次的后驗(yàn)概率)就會(huì)大于50%,如果她繼續(xù)觀測大烏鴉而且都是黑的,這個(gè)概率還會(huì)繼續(xù)上升。
另一方面,一個(gè)人也有可能在進(jìn)行觀測之前就已經(jīng)帶著非常強(qiáng)的事前主見,其程度非常強(qiáng),需要有很大量的數(shù)據(jù)才能改變這個(gè)事前主見。在20世紀(jì)80年代,美國賓夕法尼亞州的三里島核電廠發(fā)生了近乎是災(zāi)難性的事故。反應(yīng)爐的操作員面對一個(gè)很大的操作盤,通過上面的各種儀表和指示燈來了解反應(yīng)爐的運(yùn)轉(zhuǎn)情況。這些指示燈當(dāng)中有一些是警告燈,其中有的出過問題,以前曾經(jīng)發(fā)出過假的警告。當(dāng)時(shí)操作員有個(gè)事先的成見,當(dāng)他們看見任何一個(gè)新的警告燈亮?xí)r,總是認(rèn)為它是假的信號(hào)。結(jié)果,即使當(dāng)警告燈的型態(tài)及相關(guān)的指示器都一致顯示反應(yīng)爐的水位過低時(shí),他們?nèi)匀恢弥焕怼K麄兊南闰?yàn)概率太強(qiáng)了,以至于新的數(shù)據(jù)也無法使后驗(yàn)概率產(chǎn)生多大的改變。
假定只有兩種可能性,就像前面署名有爭議的聯(lián)邦主義論文的例子:它不是麥迪遜寫的就是漢密爾頓寫的。于是,在應(yīng)用了貝葉斯定理之后,就會(huì)得到了一個(gè)先驗(yàn)勝率(prior odds)與后驗(yàn)勝率(posterior odds)之間的簡單關(guān)系,這里的數(shù)據(jù)可以歸納成一種稱為“貝葉斯因子”(Bayes factor)的東西。這是一種根本不用參考先驗(yàn)勝率來刻畫數(shù)據(jù)的一種數(shù)學(xué)計(jì)算。有了這個(gè)計(jì)算工具,分析家就可以告訴讀者,插入任何他想要的先驗(yàn)勝率,乘以計(jì)算出來的貝葉斯因子,再計(jì)算后驗(yàn)勝率。莫斯特勒與華萊士對12篇署名有爭議的文章,每篇都是這樣處理的。
此外,他們對文章里的那些無特定含義的字出現(xiàn)的頻率,還進(jìn)行了兩種非貝葉斯分析。
這樣他們有了四種方法來判斷有爭議文章的作者:層次貝葉斯模型,計(jì)算的貝葉斯因子,以及兩個(gè)非貝葉斯分析方法。結(jié)果如何呢?所有12篇文章都?jí)旱剐缘刂赶螓湹线d。
實(shí)際上,如果使用計(jì)算的貝葉斯因子,那么對某幾篇文章來說,讀者認(rèn)為是漢密爾頓寫的先驗(yàn)勝率可能要大于100000:1才有辦法讓后驗(yàn)勝率為50:50。