登錄

非參數(shù)統(tǒng)計(jì)

百科 > 非參數(shù)統(tǒng)計(jì)

1.什么是非參數(shù)統(tǒng)計(jì)

非參數(shù)統(tǒng)計(jì)是統(tǒng)計(jì)學(xué)的一個(gè)重要分支,它在實(shí)踐中有著廣泛的應(yīng)用。所謂統(tǒng)計(jì)推斷,就是由樣本觀察值去了解總體,它是統(tǒng)計(jì)學(xué)的基本任務(wù)之一。若根據(jù)經(jīng)驗(yàn)或某種理論我們能在推斷之前就對(duì)總體作一些假設(shè),則這些假設(shè)無疑有助于提高統(tǒng)計(jì)推斷的效率。這種情況下的統(tǒng)計(jì)方法稱為“參數(shù)統(tǒng)計(jì)”。如果我們所知很少,以致于在推斷之前不能對(duì)總體作任何假設(shè),或僅能作一些非常一般性(例如連續(xù)分布、對(duì)稱分布等)的假設(shè),這時(shí)如果仍然使用參數(shù)統(tǒng)計(jì)方法,其統(tǒng)計(jì)推斷的結(jié)果顯然是不可信的,甚至有可能是錯(cuò)的。在對(duì)總體的分布不作假設(shè)或僅作非常一般性假設(shè)條件下的統(tǒng)計(jì)方法稱為“非參數(shù)統(tǒng)計(jì)”。

由于非參數(shù)統(tǒng)計(jì)方法與總體究竟是什么分布幾乎沒有什么關(guān)系,所以它的應(yīng)用范圍很廣,它在社會(huì)學(xué)、醫(yī)學(xué)、生物學(xué)、心理學(xué)、教育學(xué)等領(lǐng)域都有著廣泛的應(yīng)用。由于有關(guān)于總體的假設(shè),所以參數(shù)統(tǒng)計(jì)的推斷方法是針對(duì)這個(gè)假設(shè)的。相對(duì)而言,非參數(shù)統(tǒng)計(jì)的推斷方法是很一般的,它僅應(yīng)用樣本觀察值中一些非常直觀(例如次序)的信息。所以非參數(shù)統(tǒng)計(jì)分析含有豐富的統(tǒng)計(jì)思想。

2.非參數(shù)統(tǒng)計(jì)的適用范圍

非參數(shù)統(tǒng)計(jì)最常用于具備下述特征的情況:

1、待分析數(shù)據(jù)不滿足參數(shù)檢驗(yàn)所要求的假定,因而無法應(yīng)用參數(shù)檢驗(yàn)。例如,我們曾遇到過的非正態(tài)總體小樣本,在t-檢驗(yàn)法也不適用時(shí),作為替代方法,就可以采用非參數(shù)檢驗(yàn)。

2、僅由一些等級(jí)構(gòu)成的數(shù)據(jù),不能應(yīng)用參數(shù)檢驗(yàn)。例如,消費(fèi)者可能被問及對(duì)幾種不同商標(biāo)的飲料的喜歡程度,雖然,他們不能對(duì)每種商標(biāo)都指定一個(gè)數(shù)字來表示他們對(duì)該商標(biāo)的喜歡程度,卻能將幾種商標(biāo)按喜歡的順序分成等級(jí)。這種情形也宜采用非參數(shù)檢驗(yàn)。

3、所提的問題中并不包含參數(shù),也不能用參數(shù)檢驗(yàn)。例如,我們想判斷一個(gè)樣本是否為隨機(jī)樣本,采用非參數(shù)檢驗(yàn)法就是適當(dāng)?shù)摹?

4、當(dāng)我們需要迅速得出結(jié)果時(shí),也可以不用參數(shù)統(tǒng)計(jì)方法而用非參數(shù)統(tǒng)計(jì)方法來達(dá)到目的。一般說來,非參數(shù)統(tǒng)計(jì)方法所要求的計(jì)算與參數(shù)統(tǒng)計(jì)方法相比,完成起來既快且易。有些非參數(shù)統(tǒng)計(jì)方法的計(jì)算,就算對(duì)統(tǒng)計(jì)學(xué)知識(shí)不熟練的人,也能在收集數(shù)據(jù)時(shí)及時(shí)予以完成。

3.非參數(shù)統(tǒng)計(jì)的特點(diǎn)

非參數(shù)統(tǒng)計(jì)問題中對(duì)總體分布的假定要求的條件很寬,因而針對(duì)這種問題而構(gòu)造的非參數(shù)統(tǒng)計(jì)方法,不致因?yàn)閷?duì)總體分布的假定不當(dāng)而導(dǎo)致重大錯(cuò)誤,所以它往往有較好的穩(wěn)健性(見穩(wěn)健統(tǒng)計(jì)),這是一個(gè)重要特點(diǎn)。但因?yàn)榉菂?shù)統(tǒng)計(jì)方法需要照顧范圍很廣的分布,在某些情況下會(huì)導(dǎo)致其效率的降低。不過,近代理論證明了:一些重要的非參數(shù)統(tǒng)計(jì)方法,當(dāng)與相應(yīng)的參數(shù)方法比較時(shí),即使在最有利于后者的情況下,效率上的損失也很小。

由于非參數(shù)統(tǒng)計(jì)中對(duì)分布假定要求的條件寬,因而大樣本理論(見大樣本統(tǒng)計(jì))占據(jù)了主導(dǎo)地位。第二次世界大戰(zhàn)前,非參數(shù)統(tǒng)計(jì)的大樣本理論已有了一些結(jié)果,從20世紀(jì)50年代直到現(xiàn)代,更有了顯著的進(jìn)展,尤其是關(guān)于秩統(tǒng)計(jì)量與U統(tǒng)計(jì)量的大樣本理論,及基于這種理論的大樣本非參數(shù)方法,研究成果很多。

4.非參數(shù)統(tǒng)計(jì)的優(yōu)缺點(diǎn)

非參數(shù)統(tǒng)計(jì)與傳統(tǒng)的參數(shù)統(tǒng)計(jì)相比,有以下優(yōu)點(diǎn):

1、非參數(shù)統(tǒng)計(jì)方法要求的假定條件比較少,因而它的適用范圍比較廣泛。

2、多數(shù)非參數(shù)統(tǒng)計(jì)方法要求的運(yùn)算比較簡單,可以迅速完成計(jì)算取得結(jié)果,因而比較節(jié)約時(shí)間。

3、大多數(shù)非參數(shù)統(tǒng)計(jì)方法在直觀上比較容易理解,不需要太多的數(shù)學(xué)基礎(chǔ)知識(shí)和統(tǒng)計(jì)學(xué)知識(shí)。

4、大多數(shù)非參數(shù)統(tǒng)計(jì)方法可用來分析如象由等級(jí)構(gòu)成的數(shù)據(jù)資料,而對(duì)計(jì)量水準(zhǔn)較低的數(shù)據(jù)資料,參數(shù)統(tǒng)計(jì)方法卻不適用。

5、當(dāng)推論多達(dá)3個(gè)以上時(shí),非參數(shù)統(tǒng)計(jì)方法尤具優(yōu)越性。

但非參數(shù)統(tǒng)計(jì)方法也有以下缺點(diǎn):

1、由于方法簡單,用的計(jì)量水準(zhǔn)較低,因此,如果能與參數(shù)統(tǒng)計(jì)方法同時(shí)使用時(shí),就不如參數(shù)統(tǒng)計(jì)方法敏感。若為追求簡單而使用非參數(shù)統(tǒng)計(jì)方法,其檢驗(yàn)功效就要差些。這就是說,在給定的顯著性水平下進(jìn)行檢驗(yàn)時(shí),非參數(shù)統(tǒng)計(jì)方法與參數(shù)統(tǒng)計(jì)方法相比,第Ⅱ類錯(cuò)誤的概率β要大些。

2、對(duì)于大樣本,如不采用適當(dāng)?shù)慕疲?jì)算可能變得十分復(fù)雜。

評(píng)論  |   0條評(píng)論