抽樣
1.什么是抽樣
抽樣就是從研究總體中選取一部分代表性樣本的方法。例如我們要研究某城市居民的生活方式問題,那么整個(gè)城市居民都是我們的研究對(duì)象。但限于研究條件等原因,我們難以對(duì)每一個(gè)居民進(jìn)行調(diào)查研究,而只能采用一定的方法選取其中的部分居民作為調(diào)查研究的對(duì)象,這種選擇調(diào)查研究對(duì)象的過程就是抽樣。采用抽樣法進(jìn)行的調(diào)查就稱為抽樣調(diào)查。抽樣調(diào)查是最常用的調(diào)查研究方法之一,它已被廣泛應(yīng)用到社會(huì)調(diào)查、市場(chǎng)調(diào)查和輿論調(diào)查等多個(gè)領(lǐng)域。
抽樣對(duì)調(diào)查研究來說至關(guān)重要。社會(huì)科學(xué)研究的對(duì)象通常是非常復(fù)雜的,涉及到社會(huì)生活的方方面面,既包括個(gè)體行動(dòng)者,也包括群體甚至整個(gè)社區(qū)或社會(huì)。但在大多數(shù)情況下,我們難以對(duì)全部的對(duì)象做研究,而只能研究其中的一部分。對(duì)這部分研究對(duì)象的選擇就要依靠抽樣來完成,如此可以節(jié)省研究的成本和時(shí)間。但我們的研究又不是停留在所選取的樣本本身,而是通過對(duì)有代表性的樣本的分析來研究總體。故抽樣的目的,就是從研究對(duì)象總體中抽選一部分作為代表進(jìn)行調(diào)查分析,并根據(jù)這一部分樣本去推論總體情況。
2.抽樣類型
根據(jù)概率論原理常用的抽樣形式主要分為隨機(jī)抽樣和非隨機(jī)抽樣兩大類。二者的區(qū)別在于:前者按照隨機(jī)原則來抽取樣本,而后者不按隨機(jī)原則抽取樣本。
(一)隨機(jī)抽樣
隨機(jī)抽樣又稱概率抽樣,是指嚴(yán)格按照隨機(jī)原則來抽取樣本,要求總體中每個(gè)單位都有被抽取的同等機(jī)會(huì)。由隨機(jī)抽樣所抽取的樣本稱為隨機(jī)樣本,這類樣本具有較高的代表性。隨機(jī)抽樣法又分為下列五種不同的抽樣方法:
簡(jiǎn)單隨機(jī)抽樣,也稱純隨機(jī)抽樣,是指按照隨機(jī)原則從總體單位中直接抽取若干單位組成樣本。它是最基本的概率抽樣形式,也是其他幾種隨機(jī)抽樣方法的基礎(chǔ)。
2、等距隨機(jī)抽樣
等距隨機(jī)抽樣也稱機(jī)械隨機(jī)抽樣或系統(tǒng)隨機(jī)抽樣,是指按照一定的間隔,從根據(jù)一定的順序排列起來的總體單位中抽取樣本的一種方法。具體做法是:首先將總體各單位按照一定的順序排列起來,編上序號(hào);然后用總體單位數(shù)除以樣本單位數(shù)得出抽樣間隔;最后采取簡(jiǎn)單隨機(jī)抽樣的方式在第一個(gè)抽樣間隔內(nèi)隨機(jī)抽取一個(gè)單位作為第一個(gè)樣本,再依次按抽樣間隔做等距抽樣,直到抽取最后一個(gè)樣本為止。
3、分層隨機(jī)抽樣
分層隨機(jī)抽樣,也稱類型隨機(jī)抽樣,是指首先將調(diào)查對(duì)象的總體單位按照一定的標(biāo)準(zhǔn)分成各種不同的類別(或組),然后根據(jù)各類別(或組)的單位數(shù)與總體單位數(shù)的比例確定從各類別(或組)中抽取樣本的數(shù)量,最后按照隨機(jī)原則從各類(或組)中抽取樣本。
4、整群隨機(jī)抽樣
整群隨機(jī)抽樣,又稱聚類抽樣,是先把總體分為若干個(gè)子群,然后一群一群地抽取作為樣本單位。它通常比簡(jiǎn)單隨機(jī)抽樣和分層隨機(jī)抽樣更實(shí)用,像后者那樣,它也需要將總體分成類群,所不同的是,這些分類標(biāo)準(zhǔn)往往是特殊的。具體做法是:先將各子群體編碼,隨機(jī)抽取分群數(shù)碼,然后對(duì)所抽樣本群或組實(shí)施調(diào)查。因此,整群抽樣的單位不是單個(gè)的分子,而是成群成組的。凡是被抽到的群或組,其中所有的成員都是被調(diào)查的對(duì)象。這些群或組可以是一個(gè)家庭、一個(gè)班級(jí),也可以是一個(gè)街道、一個(gè)村莊。
5、分段隨機(jī)抽樣
分段隨機(jī)抽樣,也稱多段隨機(jī)抽樣或階段隨機(jī)抽樣,是一種分階段從調(diào)查對(duì)象的總體中抽取樣本進(jìn)行調(diào)查的方法。它首先要將總體單位按照一定的標(biāo)準(zhǔn)劃分為若干群體,作為抽樣的第一級(jí)單位;再將第一級(jí)單位分為若干小的群體,作為抽樣的第二級(jí)單位;以此類推,可根據(jù)需要分為第三級(jí)或第四級(jí)單位。然后,按照隨機(jī)原則從第一級(jí)單位中隨機(jī)抽取若干單位作為第一級(jí)單位樣本,再?gòu)牡谝患?jí)單位樣本中隨機(jī)抽取若干單位作為第二級(jí)單位樣本,以此類推,直至獲得所需要的樣本。
(二)非隨機(jī)抽樣
在實(shí)際的調(diào)查過程中,還有一類抽樣方法,稱之為非隨機(jī)抽樣,即它不是嚴(yán)格按照隨機(jī)原則抽取樣本,而是根據(jù)調(diào)查者的主觀經(jīng)驗(yàn)和主觀判斷選擇樣本的。
與隨機(jī)抽樣相比,雖然這類非隨機(jī)動(dòng)抽樣的代表性差,提供的資料信息較零散,難以從樣本調(diào)查的結(jié)論中對(duì)總體做出準(zhǔn)確的推斷。但是,由于它非常簡(jiǎn)便易行,并能通過對(duì)樣本的調(diào)查而大致了解總體的某些情況,對(duì)調(diào)查研究工作很有啟發(fā)性。因此,它適用于那種調(diào)查對(duì)象的總體難以具體界定,以及不需要準(zhǔn)確推斷總體情況的調(diào)查。常用非隨機(jī)抽樣的方法主要有以下幾種:
1、偶遇抽樣
偶遇抽樣,也稱方便抽樣,是指調(diào)查者將自己在特定場(chǎng)合下偶然遇到的對(duì)象作為樣本的一種方法。如在商店門口、街頭路口、車站碼頭、公園廣場(chǎng)等公共場(chǎng)所,隨便選取某些顧客、行人、旅客、觀眾等作為樣本進(jìn)行調(diào)查研究.這種方法比較簡(jiǎn)單方便,適用于探索性研究,但樣本的代表性較差,具有很大的偶然性。
2、立意抽樣
立意抽樣,也稱主觀抽樣,它是調(diào)查者根據(jù)自己的主觀印象、以往的經(jīng)驗(yàn)和對(duì)調(diào)查對(duì)象的了解來選取樣本的一種方法;這種抽樣適用于那些總體范圍較小、總體單位之間的差異較大的調(diào)查。
這種主觀抽樣所抽取的樣本是否具有代表性、所得出的結(jié)論是否準(zhǔn)確,完全取決于調(diào)查者本人的判斷能力,以及對(duì)調(diào)查對(duì)象的了解程度。因此這種方法具有很大的主觀隨意性。但是當(dāng)對(duì)總體狀況較為熟悉時(shí),用這一抽樣法所選擇的樣本也有較高的代表性。例如當(dāng)在們對(duì)某一群體作調(diào)查時(shí),就可以根據(jù)我們所了解的群體情況選取某些樣本做研究。
3、配額抽樣
配額抽樣,也稱定額抽樣,即調(diào)查者首先確定所要抽取樣本的數(shù)量,再按照一定的標(biāo)準(zhǔn)和比例分配樣本,然后從符合標(biāo)準(zhǔn)的對(duì)象中任意地抽取樣本。其方法類似于分層隨機(jī)抽樣,但它不是按照隨機(jī)原則抽取樣本。例如,我們可以根據(jù)研究目的,把總體按性別、民族等變量進(jìn)行分組,然后分配相應(yīng)的樣本數(shù)選取樣本。
這種配額抽樣比前兩種方法所抽取的樣本更有代表性,而且簡(jiǎn)便易行,在民意調(diào)查中經(jīng)常使用。但這種方法也具有很大的主觀隨意性和局限性,如蓋洛普采用此抽樣法曾幾次成功地預(yù)測(cè)了美國(guó)的總統(tǒng)大選,但在1948年總統(tǒng)選舉的民意調(diào)查中卻失敗了?,F(xiàn)在,人們有時(shí)把這一方法與隨機(jī)抽樣法結(jié)合起來使用,其效果會(huì)更好些。
4、滾雪球抽樣
滾雪球抽樣,即以少量樣本為基礎(chǔ),逐漸擴(kuò)大樣本的規(guī)模,直至找出足夠的樣本。此法適用于對(duì)調(diào)查總體不甚清楚的情況,常用于探索性的實(shí)地研究,特別適用于對(duì)小群體關(guān)系的研究。例如我們要了解某個(gè)人經(jīng)常交往的社會(huì)圈子,就可以通過這個(gè)人提供的線索找到更多與他有關(guān)聯(lián)的人。
其具體做法是,先找到一個(gè)或幾個(gè)符合研究目的的對(duì)象,然后再根據(jù)這些對(duì)象所提供的線索找另外相關(guān)的對(duì)象,依次進(jìn)行,直至達(dá)到研究目的。但滾雪球抽樣法所選擇的樣本有時(shí)會(huì)有很大的隨意性和特殊性,因而代表性不高。
3.抽樣設(shè)計(jì)與程序
在社會(huì)科學(xué)研究過程中,抽樣是必不可少的重要環(huán)節(jié)。這就要求必須做好抽樣設(shè)計(jì),使所選擇的樣本具有代表性。抽樣設(shè)計(jì)就是確定抽樣的原理與形式、程序和方法等。其基本原則是:第一,目的性,即根據(jù)研究目的進(jìn)行抽樣設(shè)計(jì);第二,可度量性,即根據(jù)樣本值能做出有效的估計(jì);第三,可行性,即在實(shí)際操作中能按預(yù)定的設(shè)計(jì)完成任務(wù);第四,經(jīng)濟(jì)性,即以最小的代價(jià)去實(shí)現(xiàn)抽樣的目的。
(一) 抽樣的原理與形式
抽樣通常分為概率抽樣和非概率抽樣兩大類,但以概率抽樣為主。概率抽樣的基本原理首先是概率論的隨機(jī)原理,所謂隨機(jī)原理,是指抽取樣本時(shí)必須嚴(yán)格遵循一定方法和規(guī)則,使得總體中每一個(gè)對(duì)象都有相同的機(jī)會(huì)被選入樣本。這又稱為等概率抽樣。因?yàn)橹挥邪凑针S機(jī)原則進(jìn)行抽樣,所抽出的樣本才有充分的代表性,也才可以對(duì)抽樣誤差做出準(zhǔn)確的計(jì)算,以估計(jì)它的可信度。
概率抽樣的理論基礎(chǔ)就是概率論。我們通常把因果關(guān)系分為兩種:一種是必然性的因果關(guān)系,即若A,則必然B;另一種是隨機(jī)性的因果關(guān)系,即若A,則可能B。大量的社會(huì)現(xiàn)象都是隨機(jī)現(xiàn)象。研究隨機(jī)現(xiàn)象的數(shù)學(xué)分支學(xué)科是概率論。概率是事物發(fā)生的可能性大小的量度。在概率論中,把不可能發(fā)生的事件的概率稱為最小概率,定為0,而把必然發(fā)生的事件的概率稱為最大概率,定為1。那么事件A出現(xiàn)的概率P(A)在0與l之間,即隨機(jī)事件發(fā)生的可能性在0到1之間,是個(gè)非負(fù)數(shù)。
(二) 抽樣的基本程序
按照一定原則進(jìn)行抽樣時(shí),大致可包括如下幾個(gè)步驟:
1、界定總體
界定總體包括明確總體的范圍、內(nèi)容和時(shí)間。實(shí)際調(diào)查的總體與理論上設(shè)定的總體會(huì)有所不同,總體越復(fù)雜,二者的差別越大。例如,要研究某地青少年的犯罪狀況,理論上的總體是這一地區(qū)符合一定條件的所有的青少年,但實(shí)際上我們能夠抽樣的總體并不能全部包括,也就是說只能根據(jù)我們所能夠掌握的這一地區(qū)符合一定條件的青少年進(jìn)行抽樣。因此,抽樣總體有時(shí)不等于理論上的研究總體,樣本所代表的也只是明確界定的抽樣總體。此外,由于調(diào)查研究?jī)?nèi)容的不同,對(duì)總體的限定也會(huì)有所不同。
2、確定抽樣框
這一步驟的任務(wù)就是依據(jù)已經(jīng)明確界定的總體范圍,收集總體中全部抽樣單位的名單,并通過對(duì)名單進(jìn)行統(tǒng)一編號(hào)進(jìn)而組合成一種可供選擇的形式,如名單、代碼、符號(hào)等。抽樣框的形式受總體類型的影響:簡(jiǎn)單的總體可直接根據(jù)其組成名單形成抽樣框;但對(duì)構(gòu)成復(fù)雜的總體,常常根據(jù)調(diào)查研究的需要,制定不同的抽樣框,分級(jí)選擇樣本。例如,進(jìn)行全國(guó)人口抽樣調(diào)查,先以全國(guó)的省市為抽樣框選部分省、市為調(diào)查單位,然后再以這些省、市中的各縣、區(qū)為抽樣框選部分縣、區(qū)為調(diào)查單位,這樣依次到村或居委會(huì)。
在概率抽樣中,抽樣框的確定非常重要,它會(huì)直接影響到樣本的代表性。因此,抽樣框要力爭(zhēng)全面、準(zhǔn)確。
3、樣本設(shè)計(jì)
樣本設(shè)計(jì)包括確定樣本規(guī)模和選擇抽樣的具體方式。抽樣的目的是用樣本來代表總體,自然樣本數(shù)越大,其代表性越高。但樣本數(shù)越大,調(diào)查研究的成本也越大。因此,確定合適的樣本規(guī)模和抽樣方式是抽樣設(shè)計(jì)中的一項(xiàng)重要內(nèi)容。我們?cè)诘谌?jié)中杵詳細(xì)討論這一問題。
4、評(píng)估樣本質(zhì)量
評(píng)估樣本質(zhì)量即通過對(duì)樣本統(tǒng)計(jì)值的分析,說明其代表性或誤差大小。對(duì)樣本代表性進(jìn)行評(píng)估的主要標(biāo)準(zhǔn)是準(zhǔn)確性和精確性:前者是指樣本的偏差,偏差越小,其準(zhǔn)確性越高;后者是指抽樣誤差,誤差越小,其精確性或代表性越高。