數(shù)理統(tǒng)計學
目錄
1.數(shù)理統(tǒng)計學概述
數(shù)理統(tǒng)計學是統(tǒng)計學的數(shù)學基礎,從數(shù)學的角度去研究統(tǒng)計學,為各種應用統(tǒng)計學提供理論支持。它研究怎樣有效地收集、整理和分析帶有隨機性的數(shù)據(jù),以對所考察的問題作出推斷或預測,直至為采取一定的決策和行動提供依據(jù)和建議的數(shù)學分支。
2.數(shù)理統(tǒng)計學的發(fā)展歷程
數(shù)理統(tǒng)計學是伴隨著概率論的發(fā)展而發(fā)展起來的。19世紀中葉以前已出現(xiàn)了若干重要的工作,如C.F.高斯和A.M.勒讓德關于觀測數(shù)據(jù)誤差分析和最小二乘法的研究。到19世紀末期,經(jīng)過包括K.皮爾森在內的一些學者的努力,這門學科已開始形成。但數(shù)理統(tǒng)計學發(fā)展成一門成熟的學科,則是20世紀上半葉的事,它在很大程度上要歸功于K.皮爾森、R.A.費希爾等學者的工作。特別是費希爾的貢獻,對這門學科的建立起了決定性的作用。1946年H.克拉默發(fā)表的《統(tǒng)計學數(shù)學方法》是第一部嚴謹且比較系統(tǒng)的數(shù)理統(tǒng)計著作,可以把它作為數(shù)理統(tǒng)計學進入成熟階段的標志。
數(shù)理統(tǒng)計學的發(fā)展大致可分3個時期。
第一時期:20 世紀以前。這個時期又可分成兩段,大致上可以把高斯和勒讓德關于最小二乘法用于觀測數(shù)據(jù)的誤差分析的工作作為分界線,前段屬萌芽時期,基本上沒有超出描述性統(tǒng)計量的范圍。后一階段可算作是數(shù)理統(tǒng)計學的幼年階段。首先,強調了推斷的地位,而擺脫了單純描述的性質。由于高斯等的工作揭示了正態(tài)分布的重要性,學者們普遍認為,在實際問題中遇見的幾乎所有的連續(xù)變量,都可以滿意地用正態(tài)分布來刻畫。這種觀點使關于正態(tài)分布的統(tǒng)計得到了深入的發(fā)展,但延緩了非參數(shù)統(tǒng)計的發(fā)展。19世紀末,K.皮爾森給出了以他的名字命名的分布,并給出了估計參數(shù)的一種方法——矩法估計。德國的F.赫爾梅特發(fā)現(xiàn)了統(tǒng)計上十分重要的x2 分布。
第二時期:20世紀初到第二次世界大戰(zhàn)結束。這是數(shù)理統(tǒng)計學蓬勃發(fā)展達到成熟的時期。許多重要的基本觀點和方法,以及數(shù)理統(tǒng)計學的主要分支學科,都是在這個時期建立和發(fā)展起來的。這個時期的成就,包含了至今仍在廣泛使用的大多數(shù)統(tǒng)計方法。在其發(fā)展中,以英國統(tǒng)計學家、生物學家費希爾為代表的英國學派起了主導作用。
第三時期:戰(zhàn)后時期。這一時期中,數(shù)理統(tǒng)計學在應用和理論兩方面繼續(xù)獲得很大的進展。
3.數(shù)理統(tǒng)計學的分支學科
數(shù)理統(tǒng)計學內容龐雜,分支學科很多,難于作出一個周密而無懈可擊的分類。大體上可以劃分為如下幾類:
第一類分支學科是抽樣調查和試驗設計。它們主要討論在觀測和實驗數(shù)據(jù)的收集中有關的理論和方法問題,但并非與統(tǒng)計推斷無關。
第二類分支學科為數(shù)甚多,其任務都是討論統(tǒng)計推斷的原理和方法。各分支的形成是基于:
?、偬囟ǖ慕y(tǒng)計推斷形式,如參數(shù)估計和假設檢驗。
?、谔囟ǖ慕y(tǒng)計觀點,如貝葉斯統(tǒng)計與統(tǒng)計決策理論。
?、厶囟ǖ睦碚撃P突驑颖窘Y構,如非參數(shù)統(tǒng)計、多元統(tǒng)計分析、回歸分析、相關分析、序貫分析,時間序列分析和隨機過程統(tǒng)計。
第三類是一些針對特殊的應用問題而發(fā)展起來的分支學科,如產(chǎn)品抽樣檢驗、可靠性統(tǒng)計、統(tǒng)計質量管理等。
4.統(tǒng)計工作諸環(huán)節(jié)
用數(shù)理統(tǒng)計方法去解決一個實際問題時,一般有如下幾個步驟 :建立數(shù)學模型 ,收集整理數(shù)據(jù),進行統(tǒng)計推斷、預測和決策。這些環(huán)節(jié)不能截然分開,也不一定按上述次序,有時是互相交錯的。
?、倌P偷倪x擇和建立。在數(shù)理統(tǒng)計學中,模型是指關于所研究總體的某種假定,一般是給總體分布規(guī)定一定的類型。建立模型要依據(jù)概率的知識、所研究問題的專業(yè)知識、以往的經(jīng)驗以及從總體中抽取的樣本(數(shù)據(jù))。
?、跀?shù)據(jù)的收集。有全面觀測、抽樣觀測和安排特定的實驗3種方式。全面觀測又稱普查,即對總體中每個個體都加以觀測,測定所需要的指標。抽樣觀測又稱抽查,是指從總體中抽取一部分,測定其有關的指標值。這方面的研究內容構成數(shù)理統(tǒng)計的一個分支學科。叫抽樣調查。
?、郯才盘囟▽嶒炓允占瘮?shù)據(jù),這些特定的實驗要有代表性,并使所得數(shù)據(jù)便于進行分析。這里面所包含的數(shù)學問題,構成數(shù)理統(tǒng)計學的又一分支學科,即實驗設計的內容。
?、?a href="/wiki/%E6%95%B0%E6%8D%AE%E6%95%B4%E7%90%86" title="數(shù)據(jù)整理">數(shù)據(jù)整理。目的是把包含在數(shù)據(jù)中的有用信息提取出來 。 一種形式是制定適當?shù)膱D表,如散點圖,以反映隱含在數(shù)據(jù)中的粗略的規(guī)律性或一般趨勢。另一種形式是計算若干數(shù)字特征,以刻畫樣本某些方面的性質,如樣本均值、樣本方差等簡單描述性統(tǒng)計量。
⑤統(tǒng)計推斷。指根據(jù)總體模型以及由總體中抽出的樣本,作出有關總體分布的某種論斷 。數(shù)據(jù)的收集和整理是進行統(tǒng)計推斷的必要準備,統(tǒng)計推斷是數(shù)理統(tǒng)計學的主要任務。
?、?a href="/wiki/%E7%BB%9F%E8%AE%A1%E9%A2%84%E6%B5%8B" title="統(tǒng)計預測">統(tǒng)計預測。統(tǒng)計預測的對象,是隨機變量在未來某個時刻所取的值,或設想在某種條件下對該變量進行觀測時將取的值。例如,預測一種產(chǎn)品在未來3年內的市場銷售量,某個10歲男孩在3年后的身高,體重等等。
?、?a href="/wiki/%E7%BB%9F%E8%AE%A1%E5%86%B3%E7%AD%96" title="統(tǒng)計決策">統(tǒng)計決策。依據(jù)所做的統(tǒng)計推斷或預測,并考慮到行動的后果(以經(jīng)濟損失的形式表示)而制定的一種行動方案。目的是使損失盡可能小,或反過來說,使收益盡可能大。例如,一個商店要決定今年內某種產(chǎn)品的進貨數(shù)量,商店的統(tǒng)計學家根據(jù)抽樣調查,預測該產(chǎn)品本店今年銷售量為1000件。假定每積壓一件產(chǎn)品損失20元,而少銷售一件產(chǎn)品則損失10元,要據(jù)此作出關于進貨數(shù)量的決策。
5.數(shù)理統(tǒng)計學的應用
數(shù)理統(tǒng)計方法在工農(nóng)業(yè)生產(chǎn)、自然科學和技術科學以及社會經(jīng)濟領域中都有廣泛的應用。
?、僭谵r(nóng)業(yè)中,對田間試驗進行適當?shù)脑O計和統(tǒng)計分析。
?、趯嶒炘O計法、回歸設計和回歸分析、方差分析、多元分析等統(tǒng)計方法,在工業(yè)生產(chǎn)的試制新產(chǎn)品和改進老產(chǎn)品、改革工藝流程、使用代用原材料和尋求適當?shù)呐浞降葐栴}中起著廣泛的作用,統(tǒng)計質量管理在控制工業(yè)產(chǎn)品的質量中起著十分重要的作用。
?、坩t(yī)學是較早使用數(shù)理統(tǒng)計方法的領域之一 。在防治一種疾病時,需要找出導致這種疾病的種種因素。統(tǒng)計方法在發(fā)現(xiàn)和驗證這些因素上,是一個重要工具。另一方面的應用是,用統(tǒng)計方法確定一種藥物對治療某種疾病是否有用,用處多大,以及比較幾種藥物或治療方法的效力。
?、茉谧匀豢茖W和技術科學中,如統(tǒng)計方法用于地震、氣象和水文方面的預報、地質資源的評介等。
?、菰谏鐣⒔?jīng)濟領域方面,如人口調查和預測,心理學中能力方面的分析等。