標(biāo)準(zhǔn)偏差
目錄
1.什么是標(biāo)準(zhǔn)偏差
標(biāo)準(zhǔn)偏差(也稱標(biāo)準(zhǔn)離差或均方根差)是反映一組測量數(shù)據(jù)離散程度的統(tǒng)計指標(biāo)。是指統(tǒng)計結(jié)果在某一個時段內(nèi)誤差上下波動的幅度。是正態(tài)分布的重要參數(shù)之一。是測量變動的統(tǒng)計測算法。它通常不用作獨立的指標(biāo)而與其它指標(biāo)配合使用。
標(biāo)準(zhǔn)偏差在誤差理論、質(zhì)量管理、計量型抽樣檢驗等領(lǐng)域中均得到了廣泛的應(yīng)用。因此, 標(biāo)準(zhǔn)偏差的計算十分重要, 它的準(zhǔn)確與否對器具的不確定度、測量的不確定度以及所接收產(chǎn)品的質(zhì)量有重要影響。然而在對標(biāo)準(zhǔn)偏差的計算中, 不少人不論測量次數(shù)多少, 均按貝塞爾公式計算。
2.樣本標(biāo)準(zhǔn)差的表示公式
數(shù)學(xué)表達式:
S-標(biāo)準(zhǔn)偏差(%)
n-試樣總數(shù)或測量次數(shù),一般n值不應(yīng)少于20-30個
i-物料中某成分的各次測量值,1~n;
3.標(biāo)準(zhǔn)偏差的使用方法
- 在價格變化劇烈時,該指標(biāo)值通常很高。
- 如果價格保持平穩(wěn),這個指標(biāo)值不高。
- 在價格發(fā)生劇烈的上漲/下降之前,該指標(biāo)值總是很低。
4.標(biāo)準(zhǔn)偏差的計算步驟
標(biāo)準(zhǔn)偏差的計算步驟是:
步驟一、(每個樣本數(shù)據(jù) - 樣本全部數(shù)據(jù)之平均值)2。
步驟二、把步驟一所得的各個數(shù)值相加。
步驟三、把步驟二的結(jié)果除以 (n - 1)(“n”指樣本數(shù)目)。
步驟四、從步驟三所得的數(shù)值之平方根就是抽樣的標(biāo)準(zhǔn)偏差。
5.六個計算標(biāo)準(zhǔn)偏差的公式[1]
標(biāo)準(zhǔn)偏差的理論計算公式
設(shè)對真值為X的某量進行一組等精度測量, 其測得值為l1、l2、……ln。令測得值l與該量真值X之差為真差占σ, 則有 σ1 = li ? X
σ2 = l2 ? X
……
σn = ln ? X
我們定義標(biāo)準(zhǔn)偏差(也稱標(biāo)準(zhǔn)差)σ為
(1)
由于真值X都是不可知的, 因此真差σ占也就無法求得, 故式只有理論意義而無實用價值。
標(biāo)準(zhǔn)偏差σ的常用估計—貝塞爾公式
由于真值是不可知的, 在實際應(yīng)用中, 我們常用n次測量的算術(shù)平均值來代表真值。理論上也證明, 隨著測量次數(shù)的增多, 算術(shù)平均值最接近真值, 當(dāng)
時, 算術(shù)平均值就是真值。
于是我們用測得值li與算術(shù)平均值之差——剩余誤差(也叫殘差)Vi來代替真差σ , 即
設(shè)一組等精度測量值為l1、l2、……ln
則
……
通過數(shù)學(xué)推導(dǎo)可得真差σ與剩余誤差V的關(guān)系為
將上式代入式(1)有
(2)
式(2)就是著名的貝塞爾公式(Bessel)。
它用于有限次測量次數(shù)時標(biāo)準(zhǔn)偏差的計算。由于當(dāng)時,
,可見貝塞爾公式與σ的定義式(1)是完全一致的。
應(yīng)該指出, 在n有限時, 用貝塞爾公式所得到的是標(biāo)準(zhǔn)偏差σ的一個估計值。它不是總體標(biāo)準(zhǔn)偏差σ。因此, 我們稱式(2)為標(biāo)準(zhǔn)偏差σ的常用估計。為了強調(diào)這一點, 我們將σ的估計值用“S ” 表示。于是, 將式(2)改寫為
(2')
在求S時, 為免去求算術(shù)平均值的麻煩, 經(jīng)數(shù)學(xué)推導(dǎo)(過程從略)有
于是, 式(2')可寫為
(2")
按式(2")求S時, 只需求出各測得值的平方和和各測得值之和的平方藝
, 即可。
標(biāo)準(zhǔn)偏差σ的無偏估計
數(shù)理統(tǒng)計中定義S2為樣本方差
數(shù)學(xué)上已經(jīng)證明S2是總體方差σ2的無偏估計。即在大量重復(fù)試驗中, S2圍繞σ2散布, 它們之間沒有系統(tǒng)誤差。而式(2')在n有限時,S并不是總體標(biāo)準(zhǔn)偏差σ的無偏估計, 也就是說S和σ之間存在系統(tǒng)誤差。概率統(tǒng)計告訴我們, 對于服從正態(tài)分布的正態(tài)總體, 總體標(biāo)準(zhǔn)偏差σ的無偏估計值為
(3)
令
則
即S1和S僅相差一個系數(shù)Kσ,Kσ是與樣本個數(shù)測量次數(shù)有關(guān)的一個系數(shù), Kσ值見表。
計算Kσ時用到
Γ(n + 1) = nΓ(n)
Γ(1) = 1
由表1知, 當(dāng)n>30時, 。因此, 當(dāng)n>30時, 式(3')和式(2')之間的差異可略而不計。在n=30~50時, 最宜用貝塞爾公式求標(biāo)準(zhǔn)偏差。當(dāng)n<10時, 由于Kσ值的影響已不可忽略, 宜用式(3'), 求標(biāo)準(zhǔn)偏差。這時再用貝塞爾公式顯然是不妥的。
標(biāo)準(zhǔn)偏差的最大似然估計
將σ的定義式(1)中的真值X用算術(shù)平均值代替且當(dāng)n有限時就得到
(4)
式(4)適用于n>50時的情況, 當(dāng)n>50時,n和(n-1)對計算結(jié)果的影響就很小了。
2.5標(biāo)準(zhǔn)偏差σ的極差估計由于以上幾個標(biāo)準(zhǔn)偏差的計算公式計算量較大, 不宜現(xiàn)場采用, 而極差估計的方法則有運算簡便, 計算量小宜于現(xiàn)場采用的特點。
極差用"R"表示。所謂極差就是從正態(tài)總體中隨機抽取的n個樣本測得值中的最大值與最小值之差。
若對某量作次等精度測量測得l1、,且它們服從正態(tài)分布, 則
R = lmax ? lmin
概率統(tǒng)計告訴我們用極差來估計總體標(biāo)準(zhǔn)偏差的計算公式為
(5)
S3稱為標(biāo)準(zhǔn)偏差σ的無偏極差估計, d2為與樣本個數(shù)n(測得值個數(shù))有關(guān)的無偏極差系數(shù), 其值見表2
由表2知, 當(dāng)n≤15時,, 因此, 標(biāo)準(zhǔn)偏差σ更粗略的估計值為
(5')
還可以看出, 當(dāng)200≤n≤1000時,因而又有
(5")
顯然, 不需查表利用式(5')和(5")了即可對標(biāo)準(zhǔn)偏差值作出快速估計, 用以對用貝塞爾公式及其他公式的計算結(jié)果進行校核。
應(yīng)指出,式(5)的準(zhǔn)確度比用其他公式的準(zhǔn)確度要低, 但當(dāng)5≤n≤15時,式(5)不僅大大提高了計算速度, 而且還頗為準(zhǔn)確。當(dāng)n>10時, 由于舍去數(shù)據(jù)信息較多, 因此誤差較大, 為了提高準(zhǔn)確度, 這時應(yīng)將測得值分成四個或五個一組, 先求出各組的極差R1、, 再由各組極差求出極差平均值
。
極差平均值和總體標(biāo)準(zhǔn)偏差的關(guān)系為
需指出, 此時d2大小要用每組的數(shù)據(jù)個數(shù)n而不是用數(shù)據(jù)總數(shù)N(=nK)去查表2。再則, 分組時一定要按測得值的先后順序排列,不能打亂或顛倒。
標(biāo)準(zhǔn)偏差σ的平均誤差估計
平均誤差的定義為
誤差理論給出
(A)
可以證明與
的關(guān)系為
(證明從略)
于是 (B)
由式(A)和式(B)得
從而有
式(6)就是佩特斯(C.A.F.Peters.1856)公式。用該公式估計δ值, 由于right|Vright|不需平方,故計算較為簡便。但該式的準(zhǔn)確度不如貝塞爾公式。該式使用條件與貝塞爾公式相似。
6.標(biāo)準(zhǔn)偏差的應(yīng)用實例[1]
對標(biāo)稱值Ra = 0.160 < math > μm < math > 的一塊粗糙度樣塊進行檢定, 順次測得以下15個數(shù)據(jù):1.45,1.65,1.60,1.67,1.52,1.46,1.72,1.69,1.77,1.64,4.56,1.50,1.64,1.74和1.63μm, 試求該樣塊Rn的平均值和標(biāo)準(zhǔn)偏差并判斷其合格否。
解:1)先求平均值
2)再求標(biāo)準(zhǔn)偏差S
若用無偏極差估計公式式(5)計算, 首先將測得的, 15個數(shù)據(jù)按原順序分為三組, 每組五個, 見表3。
表3
組號 | l_1 | l_5 | R | |||
---|---|---|---|---|---|---|
1 | 1.48 | 1.65 | 1.60 | 1.67 | 1.52 | 0.19 |
2 | 1.46 | 1.72 | 1.69 | 1.77 | 1.64 | 0.31 |
3 | 1.56 | 1.50 | 1.64 | 1.74 | 1.63 | 0.24 |
因每組為5個數(shù)據(jù), 按n=5由表2查得
故
若按常用估計即貝塞爾公式式(2') , 則
若按無偏估計公式即式(3')計算, 因n=15,由表1查得Kδ = 1.018, 則
若按最大似然估計公式即式(4')計算, 則
= 0.09296( < math > μm < math > )
若按平均誤差估計公式即式(6), 則
現(xiàn)在用式(5')對以上計算進行校核
可見以上算得的S、S1、S2、S3和S4沒有粗大誤差。
由以上計算結(jié)果可知0.09296<0.0962<0.0979<0.1017<0.1062
即 S2 < S < S1 < S4 < S3
可見, 最大似然估計值最小, 常用估計值S稍大, 無偏估計值S1又大, 平均誤差估計值S4再大, 極差估計值S3最大??v觀這幾個值, 它們相當(dāng)接近, 最大差值僅為0.01324μm。從理論上講, 用無偏估計值和常用估計比較合適, 在本例中, 它們僅相差0.0017μm??梢韵嘈? 隨著的增大, S、S1、S2、S3和S4之間的差別會越來越小。
就本例而言, 無偏極差估計值S3和無偏估計值S1僅相差0.0083μm, 這說明無偏極差估計是既可以保證一定準(zhǔn)確度計算又簡便的一種好方法。
JJG102-89《表面粗糙度比較樣塊》規(guī)定Ra的平均值對其標(biāo)稱值的偏離不應(yīng)超過+12%~17%, 標(biāo)準(zhǔn)偏差應(yīng)在標(biāo)稱值的4%~12%之間。已得本樣塊二產(chǎn),產(chǎn)均在規(guī)定范圍之內(nèi), 故該樣塊合格。
7.標(biāo)準(zhǔn)偏差與標(biāo)準(zhǔn)差的區(qū)別
標(biāo)準(zhǔn)差(Standard Deviation)各數(shù)據(jù)偏離平均數(shù)的距離(離均差)的平均數(shù),它是離差平方和平均后的方根。用σ表示。因此,標(biāo)準(zhǔn)差也是一種平均數(shù)。標(biāo)準(zhǔn)差是方差的算術(shù)平方根。標(biāo)準(zhǔn)差能反映一個數(shù)據(jù)集的離散程度。平均數(shù)相同的,標(biāo)準(zhǔn)差未必相同。
例如,A、B兩組各有6位學(xué)生參加同一次語文測驗,A組的分?jǐn)?shù)為95、85、75、65、55、45,B組的分?jǐn)?shù)為73、72、71、69、68、67。這兩組的平均數(shù)都是70,但A組的標(biāo)準(zhǔn)差為17.08分,B組的標(biāo)準(zhǔn)差為2.16分,說明A組學(xué)生之間的差距要比B組學(xué)生之間的差距大得多。
標(biāo)準(zhǔn)偏差(Std Dev,Standard Deviation) - 統(tǒng)計學(xué)名詞。一種量度數(shù)據(jù)分布的分散程度之標(biāo)準(zhǔn),用以衡量數(shù)據(jù)值偏離算術(shù)平均值的程度。標(biāo)準(zhǔn)偏差越小,這些值偏離平均值就越少,反之亦然。標(biāo)準(zhǔn)偏差的大小可通過標(biāo)準(zhǔn)偏差與平均值的倍率關(guān)系來衡量。