登錄

標(biāo)準(zhǔn)偏差

百科 > 標(biāo)準(zhǔn)偏差

1.什么是標(biāo)準(zhǔn)偏差

標(biāo)準(zhǔn)偏差(也稱標(biāo)準(zhǔn)離差或均方根差)是反映一組測(cè)量數(shù)據(jù)離散程度統(tǒng)計(jì)指標(biāo)。是指統(tǒng)計(jì)結(jié)果在某一個(gè)時(shí)段內(nèi)誤差上下波動(dòng)的幅度。是正態(tài)分布的重要參數(shù)之一。是測(cè)量變動(dòng)的統(tǒng)計(jì)測(cè)算法。它通常不用作獨(dú)立的指標(biāo)而與其它指標(biāo)配合使用。

標(biāo)準(zhǔn)偏差在誤差理論、質(zhì)量管理、計(jì)量型抽樣檢驗(yàn)等領(lǐng)域中均得到了廣泛的應(yīng)用。因此, 標(biāo)準(zhǔn)偏差的計(jì)算十分重要, 它的準(zhǔn)確與否對(duì)器具的不確定度、測(cè)量的不確定度以及所接收產(chǎn)品的質(zhì)量有重要影響。然而在對(duì)標(biāo)準(zhǔn)偏差的計(jì)算中, 不少人不論測(cè)量次數(shù)多少, 均按貝塞爾公式計(jì)算。

2.樣本標(biāo)準(zhǔn)差的表示公式

  數(shù)學(xué)表達(dá)式:

  S=sqrt{frac{sum^{n}_{i=1}left(x_i-bar{x}right)^2}{n-1}}=sqrt{frac{left(x_1-bar{x}right)^2+left(x_2-bar{x}right)^2+cdots +left(x_n-bar{x}right)^2}{n-1}}

  • S-標(biāo)準(zhǔn)偏差(%)

  • n-試樣總數(shù)或測(cè)量次數(shù),一般n值不應(yīng)少于20-30個(gè)

  • i-物料中某成分的各次測(cè)量值,1~n;

3.標(biāo)準(zhǔn)偏差的使用方法

標(biāo)準(zhǔn)偏差使用方法示圖

  • 在價(jià)格變化劇烈時(shí),該指標(biāo)值通常很高。
  • 如果價(jià)格保持平穩(wěn),這個(gè)指標(biāo)值不高。
  • 在價(jià)格發(fā)生劇烈的上漲/下降之前,該指標(biāo)值總是很低。

4.標(biāo)準(zhǔn)偏差的計(jì)算步驟

標(biāo)準(zhǔn)偏差的計(jì)算步驟是:

步驟一、(每個(gè)樣本數(shù)據(jù) - 樣本全部數(shù)據(jù)之平均值)2。

步驟二、把步驟一所得的各個(gè)數(shù)值相加。

步驟三、把步驟二的結(jié)果除以 (n - 1)(“n”指樣本數(shù)目)。

步驟四、從步驟三所得的數(shù)值之平方根就是抽樣的標(biāo)準(zhǔn)偏差。

5.六個(gè)計(jì)算標(biāo)準(zhǔn)偏差的公式[1]

標(biāo)準(zhǔn)偏差的理論計(jì)算公式

  設(shè)對(duì)真值為X的某量進(jìn)行一組等精度測(cè)量, 其測(cè)得值為l1、l2、……ln。令測(cè)得值l與該量真值X之差為真差占σ, 則有      σ1 = li ? X

  σ2 = l2 ? X

  ……

  σn = ln ? X

  我們定義標(biāo)準(zhǔn)偏差(也稱標(biāo)準(zhǔn)差)σ為

  sigma=lim_{n to infty}sqrt{frac{1}{n}sum^{n}_{i=1}sigma^2_{i}}

  =lim_{n to infty}sqrt{frac{1}{n}sum^{n}_{i=1}(l_i-X)^2} (1)

  由于真值X都是不可知的, 因此真差σ占也就無(wú)法求得, 故式只有理論意義而無(wú)實(shí)用價(jià)值。

標(biāo)準(zhǔn)偏差σ的常用估計(jì)—貝塞爾公式

  由于真值是不可知的, 在實(shí)際應(yīng)用中, 我們常用n次測(cè)量的算術(shù)平均值bar{L}(bar{L}=frac{l-1+l_2+cdots+l_n}{n})來(lái)代表真值。理論上也證明, 隨著測(cè)量次數(shù)的增多, 算術(shù)平均值最接近真值, 當(dāng)n to infty時(shí), 算術(shù)平均值就是真值。

  于是我們用測(cè)得值li與算術(shù)平均值bar{L}之差——剩余誤差(也叫殘差)Vi來(lái)代替真差σ , 即

  V_i=L_i-bar{L}

  設(shè)一組等精度測(cè)量值為l1、l2、……ln

  則 V_1=l_1-bar{L}

    V_2=l_2-bar{L}

    ……

    V_n=l_n-bar{L}

  通過(guò)數(shù)學(xué)推導(dǎo)可得真差σ與剩余誤差V的關(guān)系為

  sum^{n}_{i=1}sigma^2_{i}=frac{n}{n-1}sum^{n}_{i=1}V^2-i

  將上式代入式(1)有

  sigma=sqrt{frac{1}{n}sum^{n}_{i=1}sigma^2_i}=sqrt{frac{1}{n}frac{n}{n-1}sum^{n}_{n-1}V^2_i}

  =sqrt{frac{1}{n-1}sum^{n}_{i=1}(l_i-bar{L})^2}   (2)

  式(2)就是著名的貝塞爾公式(Bessel)。

  它用于有限次測(cè)量次數(shù)時(shí)標(biāo)準(zhǔn)偏差的計(jì)算。由于當(dāng)n to infty時(shí),bar{L} to x,(n-1) to infty,可見(jiàn)貝塞爾公式與σ的定義式(1)是完全一致的。

  應(yīng)該指出, 在n有限時(shí), 用貝塞爾公式所得到的是標(biāo)準(zhǔn)偏差σ的一個(gè)估計(jì)值。它不是總體標(biāo)準(zhǔn)偏差σ。因此, 我們稱式(2)為標(biāo)準(zhǔn)偏差σ的常用估計(jì)。為了強(qiáng)調(diào)這一點(diǎn), 我們將σ的估計(jì)值用“S ” 表示。于是, 將式(2)改寫(xiě)為

  S=sqrt{frac{1}{n-1}sum^{n}_{i=1}(l_i-bar{L})^2}  (2')

  在求S時(shí), 為免去求算術(shù)平均值bar{L}的麻煩, 經(jīng)數(shù)學(xué)推導(dǎo)(過(guò)程從略)有

  sum^{n}_{i=1}(l_i-bar{L})^2=sum^{n}_{i=1}l^2_i-frac{(sum^{n}_{i=1})^2}{n}

  于是, 式(2')可寫(xiě)為

  s=sqrt{frac{1}{n-1}left(sum^{n}_{i=1}l^2_i-frac{left(sum^n_{i=1}l_iright)^2}{n}right)}  (2")

  按式(2")求S時(shí), 只需求出各測(cè)得值的平方和sum^n_{i=1}l^2_i和各測(cè)得值之和的平方藝(sum^n_{i=1})^2 , 即可。

標(biāo)準(zhǔn)偏差σ的無(wú)偏估計(jì)

  數(shù)理統(tǒng)計(jì)中定義S2為樣本方差

  S^2=frac{1}{n-1}sum^{n}_{i=1}(l_i-bar{L})^2

  數(shù)學(xué)上已經(jīng)證明S2是總體方差σ2的無(wú)偏估計(jì)。即在大量重復(fù)試驗(yàn)中, S2圍繞σ2散布, 它們之間沒(méi)有系統(tǒng)誤差。而式(2')在n有限時(shí),S并不是總體標(biāo)準(zhǔn)偏差σ的無(wú)偏估計(jì), 也就是說(shuō)S和σ之間存在系統(tǒng)誤差。概率統(tǒng)計(jì)告訴我們, 對(duì)于服從正態(tài)分布的正態(tài)總體, 總體標(biāo)準(zhǔn)偏差σ的無(wú)偏估計(jì)值hat{sigma}

  hat{sigma}=S_1=sqrt{frac{n-1}{2}}frac{Gammaleft(frac{n-1}{2}right)}{Gammaleft(frac{n}{2}right)}sqrt{frac{1}{n-1}sum^{n}_{i=1}(l_i-bar{L})^2}  (3)

  令K_{sigma}=sqrt{frac{n-1}{2}}frac{Gammaleft(frac{n-1}{2}right)}{Gammaleft(frac{n}{2}right)}

  則 hat{sigma}=S_1=K_{sigma}S

  即S1和S僅相差一個(gè)系數(shù)Kσ,Kσ是與樣本個(gè)數(shù)測(cè)量次數(shù)有關(guān)的一個(gè)系數(shù), Kσ值見(jiàn)表。

  計(jì)算Kσ時(shí)用到

  Γ(n + 1) = nΓ(n)

  Gamma(frac{1}{2})=sqrt{pi}

  Γ(1) = 1

  標(biāo)準(zhǔn)偏差K值

  由表1知, 當(dāng)n>30時(shí), K_{sigma}=1.0087approx 1。因此, 當(dāng)n>30時(shí), 式(3')和式(2')之間的差異可略而不計(jì)。在n=30~50時(shí), 最宜用貝塞爾公式求標(biāo)準(zhǔn)偏差。當(dāng)n<10時(shí), 由于Kσ值的影響已不可忽略, 宜用式(3'), 求標(biāo)準(zhǔn)偏差。這時(shí)再用貝塞爾公式顯然是不妥的。

標(biāo)準(zhǔn)偏差的最大似然估計(jì)

  將σ的定義式(1)中的真值X用算術(shù)平均值bar{L}代替且當(dāng)n有限時(shí)就得到

  S_2=sqrt{frac{1}{n}sum^{n}_{i=1}(l_i-bar{L})^2}

  =sqrt{frac{1}{n}left(sum^{n}_{i=1}l^2_i-frac{sum_{i=1}^{n}(l_i)^2}{n}right)}  (4)

  式(4)適用于n>50時(shí)的情況, 當(dāng)n>50時(shí),n和(n-1)對(duì)計(jì)算結(jié)果的影響就很小了。

  2.5標(biāo)準(zhǔn)偏差σ的極差估計(jì)由于以上幾個(gè)標(biāo)準(zhǔn)偏差的計(jì)算公式計(jì)算量較大, 不宜現(xiàn)場(chǎng)采用, 而極差估計(jì)的方法則有運(yùn)算簡(jiǎn)便, 計(jì)算量小宜于現(xiàn)場(chǎng)采用的特點(diǎn)。

  極差用"R"表示。所謂極差就是從正態(tài)總體中隨機(jī)抽取的n個(gè)樣本測(cè)得值中的最大值與最小值之差。

  若對(duì)某量作次等精度測(cè)量測(cè)得l1、l_2cdots l_n,且它們服從正態(tài)分布, 則

  R = lmax ? lmin

  概率統(tǒng)計(jì)告訴我們用極差來(lái)估計(jì)總體標(biāo)準(zhǔn)偏差的計(jì)算公式為

  S_3=frac{1}{d_2}R  (5)

  S3稱為標(biāo)準(zhǔn)偏差σ的無(wú)偏極差估計(jì), d2為與樣本個(gè)數(shù)n(測(cè)得值個(gè)數(shù))有關(guān)的無(wú)偏極差系數(shù), 其值見(jiàn)表2

  標(biāo)準(zhǔn)偏差表2

  由表2知, 當(dāng)n≤15時(shí),a_2approxsqrt{n}, 因此, 標(biāo)準(zhǔn)偏差σ更粗略的估計(jì)值為

  S'_3=frac{1}{sqrt{n}}R  (5')

  還可以看出, 當(dāng)200≤n≤1000時(shí),d_2approx 6因而又有

  S'_3=frac{1}{6}R  (5")

  顯然, 不需查表利用式(5')和(5")了即可對(duì)標(biāo)準(zhǔn)偏差值作出快速估計(jì), 用以對(duì)用貝塞爾公式及其他公式的計(jì)算結(jié)果進(jìn)行校核。

  應(yīng)指出,式(5)的準(zhǔn)確度比用其他公式的準(zhǔn)確度要低, 但當(dāng)5≤n≤15時(shí),式(5)不僅大大提高了計(jì)算速度, 而且還頗為準(zhǔn)確。當(dāng)n>10時(shí), 由于舍去數(shù)據(jù)信息較多, 因此誤差較大, 為了提高準(zhǔn)確度, 這時(shí)應(yīng)將測(cè)得值分成四個(gè)或五個(gè)一組, 先求出各組的極差R1、R_2cdots R_k, 再由各組極差求出極差平均值bar{R}。

  bar{R}=frac{R_1+R_2+cdots+R_K}{K}

  極差平均值bar{R}和總體標(biāo)準(zhǔn)偏差的關(guān)系為

  S_3=frac{1}{d_2}bar{R}

  需指出, 此時(shí)d2大小要用每組的數(shù)據(jù)個(gè)數(shù)n而不是用數(shù)據(jù)總數(shù)N(=nK)去查表2。再則, 分組時(shí)一定要按測(cè)得值的先后順序排列,不能打亂或顛倒。

標(biāo)準(zhǔn)偏差σ的平均誤差估計(jì)

  平均誤差的定義為

  eta=lim_{n to infty}frac{left|delta_1right|+left|delta_2right|+cdots +left|delta_nright|}{n}

  =frac{sum^{n}_{i=1}left|delta_1right|}{n}

  誤差理論給出

  eta=sqrt{frac{2}{pi}}delta=0.7979sigmaapproxfrac{4}{5}sigma  (A)

  可以證明sum^{n}_{i=1}left|delta_i right|sum^{n}_{i=1}left|V_iright|的關(guān)系為

  (證明從略)

  sum^{n}_{i=1}left|delta_iright|=sqrt{frac{n}{n-1}}sum^{n}_{i=1} left| V_i right|

  于是  eta=frac{sum^{n}_{i=1}left|delta_iright|}{n}=frac{sum^{n}_{i=1}left|V_iright|}{sqrt{n(n-1)}}  (B)

  由式(A)和式(B)得

  frac{sum^{n}_{i=1}left|V_iright|}sqrt{n(n-1)}=sqrt{frac{2}{pi}}sigma

  從而有

  S_4=hat{delta}=sqrt{frac{pi}{2}}frac{sum^{n}_{i=1}left|V_iright|}{sqrt{n(n-1)}}

  =1.2533frac{sum^{n}_{i=1}left|V_iright|}{sqrt{n(n-1)}}

  approxfrac{5}{4}frac{sum^{n}_{i=1}left|V_iright|}{sqrt{n(n-1)}}

  式(6)就是佩特斯(C.A.F.Peters.1856)公式。用該公式估計(jì)δ值, 由于right|Vright|不需平方,故計(jì)算較為簡(jiǎn)便。但該式的準(zhǔn)確度不如貝塞爾公式。該式使用條件與貝塞爾公式相似。

6.標(biāo)準(zhǔn)偏差的應(yīng)用實(shí)例[1]

  對(duì)標(biāo)稱值Ra = 0.160 < math > μm < math > 的一塊粗糙度樣塊進(jìn)行檢定, 順次測(cè)得以下15個(gè)數(shù)據(jù):1.45,1.65,1.60,1.67,1.52,1.46,1.72,1.69,1.77,1.64,4.56,1.50,1.64,1.74和1.63μm, 試求該樣塊Rn的平均值和標(biāo)準(zhǔn)偏差并判斷其合格否。

  解:1)先求平均值bar{L}

  bar{L}=1.60+frac{-12+5+0+7-8-14+12+9+17+4-4-10+4+4+3}{15times 100}

  =1.60+frac{27}{15times 100}=1.618(<math>mu m<math>)

  2)再求標(biāo)準(zhǔn)偏差S

  若用無(wú)偏極差估計(jì)公式式(5)計(jì)算, 首先將測(cè)得的, 15個(gè)數(shù)據(jù)按原順序分為三組, 每組五個(gè), 見(jiàn)表3。

  表3

組號(hào)l_1
l_5
R
11.481.651.601.671.520.19
21.461.721.691.771.640.31
31.561.501.641.741.630.24

因每組為5個(gè)數(shù)據(jù), 按n=5由表2查得frac{1}{d_2}=0.43

  故

  S_3=frac{1}{d_2}bar{R}=0.43times0.247=0.10621(<math>mu m<math>)

  若按常用估計(jì)即貝塞爾公式式(2') , 則

  S=sqrt{frac{1}{n-1}sum^{n}_{i=1}(l_i-bar{L})^2}=0.0962(<math>mu m<math>)

  若按無(wú)偏估計(jì)公式即式(3')計(jì)算, 因n=15,由表1查得Kδ = 1.018, 則

  S_1=K_{delta}S=1.018times 0.0962=0.09793(<math>mu m<math>)

  若按最大似然估計(jì)公式即式(4')計(jì)算, 則

  S_2=sqrt{frac{1}{n}left[sum^n_{i=1}l^2_i-frac{(sum^n_{i=1}l_i)^2}{n}right]}

  =sqrt{frac{1}{15}timesleft(39.3985-frac{24.27^2}{15}right)}

   = 0.09296( < math > μm < math > )

  若按平均誤差估計(jì)公式即式(6), 則

  S_4=1.2533frac{sum^{n}_{i=1}|V_i|}{sqrt{n(n-1)}}

  =1.2533timesfrac{1.176}{sqrt{15times 14}}=0.1017(<math>mu m<math>)

  現(xiàn)在用式(5')對(duì)以上計(jì)算進(jìn)行校核

  S'_3=frac{1}{sqrt{n}}bar{R}=frac{1}{sqrt{15}}times 0.247=0.0637(<math>mu m<math>)

  可見(jiàn)以上算得的S、S1、S2、S3S4沒(méi)有粗大誤差。

  由以上計(jì)算結(jié)果可知0.09296<0.0962<0.0979<0.1017<0.1062

  即 S2 < S < S1 < S4 < S3

  可見(jiàn), 最大似然估計(jì)值最小, 常用估計(jì)值S稍大, 無(wú)偏估計(jì)值S1又大, 平均誤差估計(jì)值S4再大, 極差估計(jì)值S3最大。縱觀這幾個(gè)值, 它們相當(dāng)接近, 最大差值僅為0.01324μm。從理論上講, 用無(wú)偏估計(jì)值和常用估計(jì)比較合適, 在本例中, 它們僅相差0.0017μm??梢韵嘈? 隨著的增大, S、S1、S2、S3S4之間的差別會(huì)越來(lái)越小。

  就本例而言, 無(wú)偏極差估計(jì)值S3和無(wú)偏估計(jì)值S1僅相差0.0083μm, 這說(shuō)明無(wú)偏極差估計(jì)是既可以保證一定準(zhǔn)確度計(jì)算又簡(jiǎn)便的一種好方法。

  JJG102-89《表面粗糙度比較樣塊》規(guī)定Ra的平均值對(duì)其標(biāo)稱值的偏離不應(yīng)超過(guò)+12%~17%, 標(biāo)準(zhǔn)偏差應(yīng)在標(biāo)稱值的4%~12%之間。已得本樣塊二產(chǎn),bar{L}=1.618mu m,S_3=0.1062mu m產(chǎn)均在規(guī)定范圍之內(nèi), 故該樣塊合格。

7.標(biāo)準(zhǔn)偏差與標(biāo)準(zhǔn)差的區(qū)別

標(biāo)準(zhǔn)差(Standard Deviation)各數(shù)據(jù)偏離平均數(shù)的距離(離均差)的平均數(shù),它是離差平方和平均后的方根。用σ表示。因此,標(biāo)準(zhǔn)差也是一種平均數(shù)。標(biāo)準(zhǔn)差是方差的算術(shù)平方根。標(biāo)準(zhǔn)差能反映一個(gè)數(shù)據(jù)集的離散程度。平均數(shù)相同的,標(biāo)準(zhǔn)差未必相同。

例如,A、B兩組各有6位學(xué)生參加同一次語(yǔ)文測(cè)驗(yàn),A組的分?jǐn)?shù)為95、85、75、65、55、45,B組的分?jǐn)?shù)為73、72、71、69、68、67。這兩組的平均數(shù)都是70,但A組的標(biāo)準(zhǔn)差為17.08分,B組的標(biāo)準(zhǔn)差為2.16分,說(shuō)明A組學(xué)生之間的差距要比B組學(xué)生之間的差距大得多。

標(biāo)準(zhǔn)偏差(Std Dev,Standard Deviation) - 統(tǒng)計(jì)學(xué)名詞。一種量度數(shù)據(jù)分布的分散程度之標(biāo)準(zhǔn),用以衡量數(shù)據(jù)值偏離算術(shù)平均值的程度。標(biāo)準(zhǔn)偏差越小,這些值偏離平均值就越少,反之亦然。標(biāo)準(zhǔn)偏差的大小可通過(guò)標(biāo)準(zhǔn)偏差與平均值的倍率關(guān)系來(lái)衡量。

評(píng)論  |   0條評(píng)論