登錄

抽樣框

百科 > 抽樣框

1.什么是抽樣框

抽樣框又稱“抽樣框架”、“抽樣結(jié)構(gòu)”,是指對(duì)可以選擇作為樣本的總體單位列出名冊(cè)或排序編號(hào),以確定總體的抽樣范圍和結(jié)構(gòu)。設(shè)計(jì)出了抽樣框后,便可采用抽簽的方式或按照隨機(jī)數(shù)表來抽選必要的單位數(shù)。若沒有抽樣框,則不能計(jì)算樣本單位的概率,從而也就無法進(jìn)行概率選樣。

好的抽樣框應(yīng)做到:完整而不重復(fù)。

常見的抽樣框:大學(xué)學(xué)生花名冊(cè)、城市黃頁里的電話列表、工商企業(yè)名錄、街道派出所里居民戶籍冊(cè)、意向購房人信息冊(cè)……。在沒有現(xiàn)成的名單的情況下,可由調(diào)查人員自己編制。應(yīng)該注意的是,在利用現(xiàn)有的名單作為抽樣框時(shí),要先對(duì)該名錄進(jìn)行檢查,避免有重復(fù)、遺漏的情況發(fā)生。以提高樣本對(duì)總體的代表性。

例如:要從10000名職工中抽出200名組成一個(gè)樣本,則10000名職工的名冊(cè),就是抽樣框。

2.抽樣框的誤差

抽樣框誤差便是因不準(zhǔn)確或不完整的抽樣框而引起的誤差。問題是,從包含抽樣誤差的抽樣框中抽取的樣本有時(shí)無法正確地代表調(diào)研目標(biāo)的實(shí)際情況,這就存在抽樣框誤差。舉個(gè)例子,以電話號(hào)碼薄作為抽樣框,在對(duì)某地區(qū)所有住戶進(jìn)行的某種意向調(diào)查時(shí),就存在著抽樣框誤差。

理想抽樣框的標(biāo)準(zhǔn)是能夠?qū)崿F(xiàn)目標(biāo)總體與抽樣總體的一致,然而在實(shí)踐中由于設(shè)計(jì)或是資料本身等方面的原因,目標(biāo)總體與抽樣總體往往不一致,無法保證樣本的代表性,而且由于目標(biāo)總體單位數(shù)不準(zhǔn)確,對(duì)總體進(jìn)行估計(jì)時(shí)就會(huì)產(chǎn)生估計(jì)量偏倚,增大其方差。這種誤差并不是來自抽樣的隨機(jī)性,而是產(chǎn)生于不完善的抽樣框,因此稱為抽樣框誤差。抽樣框誤差是一種非抽樣誤差。

抽樣框誤差主要來自:

1、丟失目標(biāo)總體單位

丟失目標(biāo)總體單位也被稱為“涵蓋不足”,是指抽樣框沒有覆蓋全部目標(biāo)總體單位,有些目標(biāo)單位沒有在抽樣框中出現(xiàn),因而也就沒有機(jī)會(huì)被選人樣本,這些單位成為丟失目標(biāo)單位。對(duì)丟失的總體單位不能發(fā)現(xiàn)并糾正會(huì)造成調(diào)查中對(duì)總量的估計(jì)偏低。

2、包含非目標(biāo)單位

包含非目標(biāo)單位也被稱為“過涵蓋”,是指抽樣框中包含了一些不屬于研究對(duì)象的非目標(biāo)總體單位。這種偏差的影響很大,但是潛在威脅卻通常會(huì)小一些。因?yàn)榭梢栽谡{(diào)查中辨認(rèn)出非目標(biāo)元素并把它們剔除。一般情況下,由于抽樣框中存在非目標(biāo)總體單位,容易造成估計(jì)量的高估。

3、丟失目標(biāo)單位和包含非目標(biāo)單位共存

丟失目標(biāo)單位和非目標(biāo)單位共存是指在抽樣框中既有丟失目標(biāo)單位,也有包含非目標(biāo)單位。在實(shí)際調(diào)查中,丟失目標(biāo)單位不易被查覺和發(fā)現(xiàn),具有較大的隱蔽性,相比之下,包含非目標(biāo)單位的抽樣框誤差的威脅性要小些。因?yàn)樵谡{(diào)查過程中,非目標(biāo)單位容易被發(fā)現(xiàn),并予以剔除。此外,如果丟失目標(biāo)單位和非目標(biāo)單位數(shù)量相當(dāng),也相互抵消,估計(jì)量是否會(huì)產(chǎn)生偏差也難以斷定。這要取決于丟失目標(biāo)單位和非目標(biāo)單位的數(shù)量特征是否有顯著差異。

4、復(fù)合連接

復(fù)合連接是指抽樣框單元與目標(biāo)總體單元不完全一一對(duì)應(yīng),而是存在一對(duì)多、多對(duì)一或是多對(duì)多模式的現(xiàn)象。在前一種模式中,若進(jìn)行簡(jiǎn)單隨機(jī)抽樣,能保證每個(gè)目的總體單位以同等的可能性被抽中。在后兩種模式中進(jìn)行簡(jiǎn)單隨機(jī)抽樣,每個(gè)目的總體單位被抽中的概率是不同的,從而使估計(jì)量產(chǎn)生偏斜。例如:若某銀行想了解其客戶的情況進(jìn)行一次抽樣調(diào)查,則該行所有客戶構(gòu)成目的總體。選擇的抽樣框是銀行的來往帳目,這就構(gòu)成了多對(duì)一模式。若在這個(gè)框中進(jìn)行抽樣,則來往帳目多的客戶被抽中的可能性則較大,反之來往帳目少的客戶被抽中的可能性很小,而兩種客戶通常會(huì)有較大差異,從而造成樣本的偏斜,使估計(jì)量產(chǎn)生偏差。

5、不正確的輔助信息

不正確的輔助信息誤差也被稱為稱為“內(nèi)容上的偏差”,這種誤差的主要影響是降低估計(jì)的精度。許多抽樣框中包含了輔助信息,可用于特殊的抽樣設(shè)計(jì)和估計(jì)技術(shù)??捎眠@些輔助信息來進(jìn)行分層抽樣,對(duì)規(guī)模大小的測(cè)度用于與規(guī)模成比例的概率抽樣。如果輔助信息的特征與研究的調(diào)查變量的特征高度相關(guān),還可以用于比率估計(jì)和回歸估計(jì)。但是這些輔助信息可能有錯(cuò)誤,或者是一些抽樣單位不具備輔助信息,那么就會(huì)對(duì)抽樣精度產(chǎn)生巨大的影響。

6、抽樣框老化

抽樣框老化又被稱為“抽樣框過時(shí)”或“不準(zhǔn)確的抽樣框”,是指隨著時(shí)間的推移,抽樣總體與目標(biāo)總體產(chǎn)生極大的偏差,即原來的抽樣框不符合實(shí)際情況,必須進(jìn)行更新。最典型的例子,就是隨著城市建設(shè)的大規(guī)模展開,許多地區(qū)已被改造,地址發(fā)生了變化,如果仍按以前的抽樣框去抽樣,那么精度就會(huì)難以控制。

可以采取以下方法減少抽樣框誤差:

1、在抽選樣本之前,要對(duì)抽樣框加以檢查,發(fā)現(xiàn)可能存在的問題,進(jìn)行識(shí)別、處理,并采取一定措施加以補(bǔ)救。

可以和普查或其他調(diào)查資料的總值或記錄等相比較、分析,進(jìn)而查明是否存在遺漏。可以利用客觀現(xiàn)實(shí)的相互聯(lián)系,找出平衡關(guān)系,推算是否有偏差。發(fā)現(xiàn)存在問題時(shí),要及時(shí)進(jìn)行補(bǔ)救。當(dāng)一些目標(biāo)總體單位對(duì)調(diào)查結(jié)論不會(huì)產(chǎn)生太大影響時(shí),可重新把抽樣框定義為可以得到的目標(biāo)總體單位,將抽樣框視為舊抽樣框所能提供的總體。當(dāng)抽樣框不能涵蓋抽樣總體時(shí),就可以采用輔助抽樣框,采用此法要避免目標(biāo)單位的重疊。

2、聯(lián)接遺漏單位法,就是指把抽樣樣本遺漏的個(gè)體和抽樣樣本中某個(gè)值相聯(lián)接,其聯(lián)接規(guī)則必須在調(diào)查前明確規(guī)定。其前提條件是在抽樣過程中能發(fā)現(xiàn)被遺漏的單位。

此外,對(duì)抽樣框進(jìn)行清查是最費(fèi)力、最繁瑣也是效果最好的一種方法。在臨近調(diào)查前,重新獨(dú)立構(gòu)建抽樣框的全部或部分。

3.抽樣框與抽樣單元

抽樣框與抽樣單元是抽樣的一對(duì)基本范疇。其單元滿足“與實(shí)際總體的每個(gè)單元之間存在確定的對(duì)應(yīng)關(guān)系,憑借這種對(duì)應(yīng)關(guān)系可以找到實(shí)際總體中特定的一個(gè)或一些單元”條件的實(shí)際總體的映射總體稱為抽樣框,構(gòu)成映射總體的單元?jiǎng)t稱為抽樣單元。

換言之,包含所有抽樣單元的總體稱為抽樣框,構(gòu)成抽樣框的單元稱為抽樣單元。

事實(shí)上,為了方便抽樣的實(shí)施,必須擁有一個(gè)目錄性清單,這個(gè)目錄性清單中的每個(gè)目錄項(xiàng)與實(shí)際總體的每個(gè)單元之間存在確定的對(duì)應(yīng)關(guān)系,即根據(jù)一個(gè)目錄項(xiàng)總可以找到實(shí)際總體中特定的一個(gè)或一些單元。抽樣框就是這種一個(gè)目錄性清單。

抽樣框可能以各種形式出現(xiàn):名單、手冊(cè)、地圖、數(shù)據(jù)包……。由于無論抽樣框采取何種形式,在抽樣之后,調(diào)查者必須能夠根據(jù)抽樣框找到具體的抽樣單元。因此,抽樣框必須是有序的,即抽樣單元必須編號(hào),且根據(jù)某種順序進(jìn)行了排列;抽樣框中包含的抽樣單元?jiǎng)?wù)必要“不重不漏”,否則將出現(xiàn)抽樣誤差。

抽樣單元不僅指構(gòu)成抽樣框的目錄項(xiàng),同時(shí)還表示該目錄項(xiàng)所對(duì)應(yīng)的實(shí)際總體特定的一個(gè)或一些單元。形象地說,不僅是影子,還是影子所反映的實(shí)體。盡管目前所見的抽樣文獻(xiàn)對(duì)此不置一詞,但讀者記住這一點(diǎn)仍大有裨益。為了區(qū)分抽樣單元的這兩種不同意義,實(shí)體抽樣單元又稱為樣本單元或樣本點(diǎn)。

抽樣單元不一定是組成總體的最小單位——基本單元。抽樣單元可能包含一個(gè)或一些基本單元,最簡(jiǎn)單的情況是只包含一個(gè)基本單元。在簡(jiǎn)單隨機(jī)抽樣中,抽樣單元即為基本單元;而在整群抽樣中,群即為抽樣單元,而群可能包含相當(dāng)多的基本單元,比如在手機(jī)調(diào)查中我們抽中一棟居民樓,居民樓是抽樣單元,而樓中的每個(gè)居民就是基本單元。

評(píng)論  |   0條評(píng)論