統(tǒng)計(jì)決策理論
1.統(tǒng)計(jì)決策理論的概述
統(tǒng)計(jì)決策理論是由統(tǒng)計(jì)學(xué)家A.瓦爾德在1950年提出的一種數(shù)理統(tǒng)計(jì)學(xué)的理論,這種理論把數(shù)理統(tǒng)計(jì)問(wèn)題看成是統(tǒng)計(jì)學(xué)家與大自然之間的博弈;用這種觀點(diǎn)把各種各樣的統(tǒng)計(jì)問(wèn)題統(tǒng)一起來(lái),以對(duì)策論的觀點(diǎn)來(lái)研究。在此以前,人們對(duì)數(shù)理統(tǒng)計(jì),主要是著眼于其推斷的功能,亦即從觀測(cè)數(shù)據(jù)出發(fā)對(duì)總體作出某種論斷。至于由此應(yīng)該采取什么決策或行動(dòng),會(huì)產(chǎn)生什么后果,則被認(rèn)為不屬于統(tǒng)計(jì)的范疇。瓦爾德的理論則把后面這一部分內(nèi)容也納入統(tǒng)計(jì)的范圍之內(nèi),這在數(shù)理統(tǒng)計(jì)學(xué)上是一項(xiàng)革新,有較大的實(shí)際意義。
在一個(gè)統(tǒng)計(jì)問(wèn)題中,統(tǒng)計(jì)工作者掌握的資料是樣本X =(x1,x2…,xn),X所來(lái)自的總體的分布Fθ中包含的參數(shù)θ為未知,而只知道θ所屬的集合Θ(Θ為θ所有可能取值的集合,稱為參數(shù)空間)。但是,采取什么決策最好,則取決于未知的θ值。用形象化的說(shuō)法,θ是由大自然在參數(shù)空間中選定的,人們力圖去找到它。大自然掌握了θ的秘密,而這個(gè)秘密又通過(guò)樣本泄露出來(lái),統(tǒng)計(jì)工作者的任務(wù)就是根據(jù)樣本 X中所包含的關(guān)于θ的信息,去作出良好的決策。例如,一家商店根據(jù)抽樣決定是否接受一批來(lái)貨,一個(gè)工廠根據(jù)市場(chǎng)調(diào)查的結(jié)果決定某種產(chǎn)品生產(chǎn)多少等,希望所采取的行動(dòng)取得盡可能好的效果,或者說(shuō),使“行動(dòng)不當(dāng)”所造成的損失盡可能小。
2.統(tǒng)計(jì)決策三要素
可以通過(guò)三個(gè)要素把一個(gè)統(tǒng)計(jì)決策問(wèn)題表達(dá)出來(lái)。
① 樣本空間H與樣本分布族{Fθ:θ∈Θ}這個(gè)要素規(guī)定了問(wèn)題的概率模型。樣本空間是樣本可能的取值范圍,而樣本分布族是樣本所可能遵從的分布的集合。
② 行動(dòng)空間A 它是統(tǒng)計(jì)工作者可以采取的單純策略(或稱行動(dòng))的集合。例如,設(shè)θ為一維參數(shù),要對(duì)θ作區(qū)間估計(jì),則實(shí)軸上任一區(qū)間[a,b]構(gòu)成一個(gè)單純策略,這時(shí)行動(dòng)空間為所有[a,b]構(gòu)成的集合,即{[a,b]:-∞<a≤b<∞}。若問(wèn)題是要檢驗(yàn)有關(guān)θ的假設(shè),則行動(dòng)空間A由a0(接受假設(shè))和a1(拒絕假設(shè))兩個(gè)元素構(gòu)成。
③ 損失函數(shù)L統(tǒng)計(jì)決策理論有一個(gè)基本出發(fā)點(diǎn):所采取的行動(dòng)的后果可以數(shù)量化。設(shè)參數(shù)真值為θ,統(tǒng)計(jì)工作者采取的行動(dòng)為a,則所遭受的損失可表為a與θ的函數(shù)L(θ, a),稱之為損失函數(shù)。在一個(gè)具體問(wèn)題中,采取什么損失函數(shù)最好,是一個(gè)需要進(jìn)行大量調(diào)查研究以至理論工作的問(wèn)題,這也是在使用決策理論時(shí)的一個(gè)困難點(diǎn)。