描述統(tǒng)計(jì)學(xué)
目錄
1.描述統(tǒng)計(jì)學(xué)概述
描述統(tǒng)計(jì)(descriptive statistics)是來描繪(describe)或總結(jié)(summarize)的觀察量的基本情況的統(tǒng)計(jì)總稱。描述統(tǒng)計(jì)學(xué)研究如何取得反映客觀現(xiàn)象的數(shù)據(jù),并通過圖表形式對所收集的數(shù)據(jù)進(jìn)行加工處理和顯示,進(jìn)而通過綜合概括與分析得出反映客觀現(xiàn)象的規(guī)律性數(shù)量特征。
2.描述統(tǒng)計(jì)學(xué)的內(nèi)容
描述統(tǒng)計(jì)學(xué)內(nèi)容包括統(tǒng)計(jì)數(shù)據(jù)的收集方法、數(shù)據(jù)的加工處理方法、數(shù)據(jù)的顯示方法、數(shù)據(jù)分布特征的概括與分析方法等。
- 研究者可以透過對于數(shù)據(jù)資料的進(jìn)行圖像化處理,將資料摘要變?yōu)閳D表,以直觀了解整體資料分布的情況。通常會使用的工具是頻數(shù)分布表 (frequency distribution table)與圖示法,如多邊圖(polygon)、直方圖(histogram, bar chart)、圓形圖(pie chart)、散點(diǎn)圖(scatter plot)等。
- 研究者也可以透過分析數(shù)據(jù)資料,以了解各變量內(nèi)的觀察值集中與分散的情況。運(yùn)用的工具有:集中量數(shù)(measure of central location),如平均數(shù)(Mean)、中位數(shù)(Median, Md)、眾數(shù)(Mode, Mo)、幾何平均數(shù)(Geometric mean, GM)、調(diào)和平均數(shù)(Harmonic mean, HM)。與變異量數(shù)(measure of variation),如全距(range)、平均差(average deviation, AD)、標(biāo)準(zhǔn)差(standard deviation, SD)、相對差、四分差(quartile deviation)。
在推論統(tǒng)計(jì)中,測量樣本的集中量數(shù)與變異量數(shù)都是變量(parameter)的不偏估計(jì)值,但是以平均數(shù)、變異數(shù)、標(biāo)準(zhǔn)差的有效性最高。
- 數(shù)據(jù)的次數(shù)分配情況,往往會呈現(xiàn)常態(tài)分配。為了表示測量數(shù)據(jù)與常態(tài)分配偏離的情況,會使用偏態(tài)(skewness)、峰度(kurtosis)這兩種統(tǒng)計(jì)數(shù)據(jù)。
- 為了解個別觀察值在整體中所占的位置,會需要將觀察值轉(zhuǎn)換為相對量數(shù),如百分等級(percentage rank, PR),或標(biāo)準(zhǔn)分?jǐn)?shù)(Z score, T score)。
3.描述統(tǒng)計(jì)學(xué)與推論統(tǒng)計(jì)學(xué)的異同點(diǎn)[1]
數(shù)理統(tǒng)計(jì)學(xué)派統(tǒng)計(jì)學(xué),系由描述統(tǒng)計(jì)學(xué)與推斷統(tǒng)劉“學(xué)所。構(gòu)成。二者有共性,也有特性。
一、描述統(tǒng)計(jì)學(xué)與推論統(tǒng)計(jì)學(xué)的同點(diǎn):
兩者都以概率論為理論基礎(chǔ),都是數(shù)理統(tǒng)計(jì)學(xué),都是應(yīng)用數(shù)學(xué)的一個分支,都可分為數(shù)理統(tǒng)計(jì)([數(shù)理]統(tǒng)計(jì)理論與方法)與應(yīng)用統(tǒng)計(jì)(專業(yè)統(tǒng)計(jì))兩部分,都屬于。研究自然與社會現(xiàn)象的通用科學(xué)。
二、描述統(tǒng)計(jì)學(xué)與推論統(tǒng)計(jì)學(xué)的異點(diǎn):
第一、產(chǎn)生年代不同:一般認(rèn)為描述統(tǒng)計(jì)學(xué)產(chǎn)生于二十世紀(jì)二十年代以前,以K.畢爾生為代表;推斷統(tǒng)計(jì)學(xué)產(chǎn)生于二十世紀(jì)二十年代以后,以費(fèi)雪為代表。一說以費(fèi)雪為分界點(diǎn),費(fèi)雪以前為描述統(tǒng)計(jì)學(xué),費(fèi)雪以后為推斷統(tǒng)計(jì)學(xué);這兩個階段并無明確的分界時間,其發(fā)展是漸進(jìn)的,不是突變的。
第二、研究特點(diǎn)不同:描述統(tǒng)計(jì)學(xué)研究如何簡縮數(shù)據(jù)并描述這些數(shù)據(jù)的方法,一般包括:統(tǒng)計(jì)調(diào)查方法,分類原理,匯總,統(tǒng)計(jì)表,統(tǒng)計(jì)圖,頻數(shù)分配,時間數(shù)列,指數(shù),相關(guān),估計(jì)推算等。推斷統(tǒng)計(jì)學(xué)研究如何在隨機(jī)抽樣的基礎(chǔ)上推論有關(guān)總體數(shù)量特征的方法,一般包括:統(tǒng)計(jì)推斷原上推論有關(guān)總體數(shù)量特征的方法,一般包括:統(tǒng)計(jì)推斷原理,實(shí)驗(yàn)設(shè)計(jì),估計(jì)理論,抽樣調(diào)查,復(fù)變數(shù)分析,序列分析,誤差理論,假設(shè)檢驗(yàn),決策理論等。
第三、研究樣本不同:描述統(tǒng)計(jì)學(xué)研究大樣本理論,所謂大樣本即包括多數(shù)個體或多數(shù)數(shù)值的樣本;推斷統(tǒng)計(jì)學(xué)肝究小樣本理論,所謂小樣本即包括少數(shù)個體或少數(shù)數(shù)惱的樣本。應(yīng)當(dāng)指出,大小或多少之分也是相對的,缺乏嚴(yán)格的劃分標(biāo)消。據(jù)多數(shù)統(tǒng)汁學(xué)者的意見:如果研究的是一個糧純項(xiàng)目,則包含三十項(xiàng)以上的數(shù)值或個體的樣本即可視為大樣本;但也有人主張采用五十或一百為劃分標(biāo)準(zhǔn)的。
第四、應(yīng)用統(tǒng)計(jì)的性質(zhì)不完全相同。描述統(tǒng)計(jì)學(xué)派和推斷統(tǒng)計(jì)學(xué)派都把其統(tǒng)計(jì)學(xué)看作是通用科學(xué),可以用來研究自然與社會現(xiàn)象;但在其應(yīng)用統(tǒng)計(jì)方面則略有不同。描述統(tǒng)計(jì)學(xué)派在應(yīng)用統(tǒng)計(jì)——生物統(tǒng)計(jì)、經(jīng)濟(jì)統(tǒng)計(jì)等方面,仍殘留者凱特勒的實(shí)質(zhì)科學(xué)的影響;推斷統(tǒng)計(jì)學(xué)在應(yīng)用統(tǒng)計(jì)——物理統(tǒng)計(jì)、田間設(shè)計(jì)、質(zhì)量管理、經(jīng)濟(jì)預(yù)測等方面,基本上已轉(zhuǎn)變?yōu)橥ㄓ玫姆椒ㄕ摽茖W(xué)。