描述統(tǒng)計學
1.描述統(tǒng)計學概述
描述統(tǒng)計(descriptive statistics)是來描繪(describe)或總結(jié)(summarize)的觀察量的基本情況的統(tǒng)計總稱。描述統(tǒng)計學研究如何取得反映客觀現(xiàn)象的數(shù)據(jù),并通過圖表形式對所收集的數(shù)據(jù)進行加工處理和顯示,進而通過綜合概括與分析得出反映客觀現(xiàn)象的規(guī)律性數(shù)量特征。
2.描述統(tǒng)計學的內(nèi)容
描述統(tǒng)計學內(nèi)容包括統(tǒng)計數(shù)據(jù)的收集方法、數(shù)據(jù)的加工處理方法、數(shù)據(jù)的顯示方法、數(shù)據(jù)分布特征的概括與分析方法等。
- 研究者可以透過對于數(shù)據(jù)資料的進行圖像化處理,將資料摘要變?yōu)閳D表,以直觀了解整體資料分布的情況。通常會使用的工具是頻數(shù)分布表 (frequency distribution table)與圖示法,如多邊圖(polygon)、直方圖(histogram, bar chart)、圓形圖(pie chart)、散點圖(scatter plot)等。
- 研究者也可以透過分析數(shù)據(jù)資料,以了解各變量內(nèi)的觀察值集中與分散的情況。運用的工具有:集中量數(shù)(measure of central location),如平均數(shù)(Mean)、中位數(shù)(Median, Md)、眾數(shù)(Mode, Mo)、幾何平均數(shù)(Geometric mean, GM)、調(diào)和平均數(shù)(Harmonic mean, HM)。與變異量數(shù)(measure of variation),如全距(range)、平均差(average deviation, AD)、標準差(standard deviation, SD)、相對差、四分差(quartile deviation)。
在推論統(tǒng)計中,測量樣本的集中量數(shù)與變異量數(shù)都是變量(parameter)的不偏估計值,但是以平均數(shù)、變異數(shù)、標準差的有效性最高。
- 數(shù)據(jù)的次數(shù)分配情況,往往會呈現(xiàn)常態(tài)分配。為了表示測量數(shù)據(jù)與常態(tài)分配偏離的情況,會使用偏態(tài)(skewness)、峰度(kurtosis)這兩種統(tǒng)計數(shù)據(jù)。
- 為了解個別觀察值在整體中所占的位置,會需要將觀察值轉(zhuǎn)換為相對量數(shù),如百分等級(percentage rank, PR),或標準分數(shù)(Z score, T score)。
3.描述統(tǒng)計學與推論統(tǒng)計學的異同點[1]
數(shù)理統(tǒng)計學派統(tǒng)計學,系由描述統(tǒng)計學與推斷統(tǒng)劉“學所。構(gòu)成。二者有共性,也有特性。
一、描述統(tǒng)計學與推論統(tǒng)計學的同點:
兩者都以概率論為理論基礎(chǔ),都是數(shù)理統(tǒng)計學,都是應(yīng)用數(shù)學的一個分支,都可分為數(shù)理統(tǒng)計([數(shù)理]統(tǒng)計理論與方法)與應(yīng)用統(tǒng)計(專業(yè)統(tǒng)計)兩部分,都屬于。研究自然與社會現(xiàn)象的通用科學。
二、描述統(tǒng)計學與推論統(tǒng)計學的異點:
第一、產(chǎn)生年代不同:一般認為描述統(tǒng)計學產(chǎn)生于二十世紀二十年代以前,以K.畢爾生為代表;推斷統(tǒng)計學產(chǎn)生于二十世紀二十年代以后,以費雪為代表。一說以費雪為分界點,費雪以前為描述統(tǒng)計學,費雪以后為推斷統(tǒng)計學;這兩個階段并無明確的分界時間,其發(fā)展是漸進的,不是突變的。
第二、研究特點不同:描述統(tǒng)計學研究如何簡縮數(shù)據(jù)并描述這些數(shù)據(jù)的方法,一般包括:統(tǒng)計調(diào)查方法,分類原理,匯總,統(tǒng)計表,統(tǒng)計圖,頻數(shù)分配,時間數(shù)列,指數(shù),相關(guān),估計推算等。推斷統(tǒng)計學研究如何在隨機抽樣的基礎(chǔ)上推論有關(guān)總體數(shù)量特征的方法,一般包括:統(tǒng)計推斷原上推論有關(guān)總體數(shù)量特征的方法,一般包括:統(tǒng)計推斷原理,實驗設(shè)計,估計理論,抽樣調(diào)查,復變數(shù)分析,序列分析,誤差理論,假設(shè)檢驗,決策理論等。
第三、研究樣本不同:描述統(tǒng)計學研究大樣本理論,所謂大樣本即包括多數(shù)個體或多數(shù)數(shù)值的樣本;推斷統(tǒng)計學肝究小樣本理論,所謂小樣本即包括少數(shù)個體或少數(shù)數(shù)惱的樣本。應(yīng)當指出,大小或多少之分也是相對的,缺乏嚴格的劃分標消。據(jù)多數(shù)統(tǒng)汁學者的意見:如果研究的是一個糧純項目,則包含三十項以上的數(shù)值或個體的樣本即可視為大樣本;但也有人主張采用五十或一百為劃分標準的。
第四、應(yīng)用統(tǒng)計的性質(zhì)不完全相同。描述統(tǒng)計學派和推斷統(tǒng)計學派都把其統(tǒng)計學看作是通用科學,可以用來研究自然與社會現(xiàn)象;但在其應(yīng)用統(tǒng)計方面則略有不同。描述統(tǒng)計學派在應(yīng)用統(tǒng)計——生物統(tǒng)計、經(jīng)濟統(tǒng)計等方面,仍殘留者凱特勒的實質(zhì)科學的影響;推斷統(tǒng)計學在應(yīng)用統(tǒng)計——物理統(tǒng)計、田間設(shè)計、質(zhì)量管理、經(jīng)濟預測等方面,基本上已轉(zhuǎn)變?yōu)橥ㄓ玫姆椒ㄕ摽茖W。