組距式變量數(shù)列
1.什么是組距式變量數(shù)列
組距式變量數(shù)列簡稱組距數(shù)列,是指在變量數(shù)列中的每一個組,并不是由一個變量值來表示,而是由表明一定變動范圍或表示一定距離的兩個變量值所形成的數(shù)列。
組距式變量數(shù)列又可分為:等距式數(shù)列與不等距式數(shù)列;開口式數(shù)列與封閉式數(shù)列等。
2.組距式變量數(shù)列的編制
在編制過程中,要正確處理的具體問題。
①組數(shù)與組距
編制組距數(shù)列,必須對總體進(jìn)行分組,針對一個總體,應(yīng)將其分為多少組,這要根據(jù)研究的目的來確定,同時要本著以能簡單明了地反映問題為原則。如果組數(shù)過多,必然會造成總體單位分布分散,同時還有可能把屬于同類的單位歸到不同的組中,不能真實反映出事物的本質(zhì)特點和規(guī)律性;如果組數(shù)過少,又會造成把不同性質(zhì)的單位歸到同一個組內(nèi),失去區(qū)別事物的界限,達(dá)不到正確反映客觀事實的目的。因此,必須恰當(dāng)?shù)卮_定組數(shù)。美國學(xué)者斯特奇斯 (HASturges)提出,在總體各單位標(biāo)志值分布趨于正態(tài)的情況下,可根據(jù)總體單位數(shù)(N)來確定應(yīng)分組數(shù)(n),公式為:
n=1+3.322lgN
上式可供分組時參考,但也不能生搬硬套。當(dāng)總體單位數(shù)過少時,按上述公式計算的組數(shù)可能偏多;而當(dāng)總體單位數(shù)很多時,計算的組數(shù)又可能偏少。
確定組數(shù)后,還應(yīng)確定組距。組數(shù)和組距之間存在著密切關(guān)系。在全距(最大變量值與最小變量值之差)一定的情況下,組距的大小和標(biāo)志變量數(shù)列的全距大小成正比變化,與組數(shù)多少成反比變化。
組數(shù)越多,組距越小;組數(shù)越少,組距越大。由于組距數(shù)列有等距數(shù)列與異距數(shù)列之分,在采用等距分組的情況下,變量數(shù)列編制的組距(d)可采用下列公式確定:
組距數(shù)列中,每個組都有兩個端點,這兩個端點稱為組限。數(shù)值小的端點稱為組的下限,數(shù)值大的端點稱為組的上限。
若一組內(nèi)有上限缺下限,或有下限缺上限稱為開口組;
若一組內(nèi)的上限、下限都齊全稱為閉口組。
組距數(shù)列掩蓋了組內(nèi)各單位的實際變量值,通常用組中值近似地代替每組變量值的一般水平。
注意:用組中值來代表各組的一般水平時,變量值在該組應(yīng)呈均勻分布,或在組中值兩側(cè)呈對稱分布,否則,用組中值作為一組的代表值會有一定的誤差。