統(tǒng)計(jì)推斷

1.什么是統(tǒng)計(jì)推斷

統(tǒng)計(jì)在研究現(xiàn)象的總體數(shù)量關(guān)系時，需要了解的總體對象的范圍往往是很大的，有時甚至是無限的，而由于經(jīng)費(fèi)、時間和精力等各種原因，以致有時在客觀上只能從中觀察部分單位或有限單位進(jìn)行計(jì)算和分析，根據(jù)局部觀察結(jié)果來推斷總體。例如，要說明一批燈泡的平均使用壽命，只能從該批燈泡中抽取一小部分進(jìn)行檢驗(yàn)，推斷這一批燈泡的平均使用壽命，并給出這種推斷的置信程度。這種在一定置信程度下，根據(jù)樣本資料的特征，對總體的特征做出估計(jì)和預(yù)測的方法稱為統(tǒng)計(jì)推斷法。統(tǒng)計(jì)推斷是現(xiàn)代統(tǒng)計(jì)學(xué)的基本方法，在統(tǒng)計(jì)研究中得到了極為廣泛的應(yīng)用，它既可以用于對總體參數(shù)的估計(jì)，也可以用作對總體某些分布特征的假設(shè)檢驗(yàn)。

統(tǒng)計(jì)推斷是在概率論的基礎(chǔ)上依據(jù)樣本的有關(guān)數(shù)據(jù)和信息，對未知總體的質(zhì)量特性參數(shù)，做出合理的判斷和估計(jì)。它的一般過程如圖l所示。

統(tǒng)計(jì)推斷

統(tǒng)計(jì)推斷有著廣泛的用途，幾乎遍及所有科學(xué)技術(shù)領(lǐng)域，在質(zhì)量管理活動中應(yīng)用尤其普遍。因此，討論統(tǒng)計(jì)推斷是一個十分有意義的課題。

2.統(tǒng)計(jì)推斷的必要性

為什么我們不能直接研究對象的全部情況，而只能取得研究對象的部分信息來推斷和估計(jì)整體的某些規(guī)律呢？

1、在產(chǎn)品可靠性T程領(lǐng)域，研究某種產(chǎn)品在規(guī)定條件下和規(guī)定時間內(nèi)完成規(guī)定功能的概率時，通常要做破壞性檢驗(yàn)和試驗(yàn)，如燈泡的壽命測試、焊縫的強(qiáng)度檢驗(yàn)、電視機(jī)無故障工作時間的確定等。我們只能通過抽取樣本，對樣本進(jìn)行破壞性試驗(yàn)后，推斷總體的可靠性指標(biāo)。如果對所有產(chǎn)品進(jìn)行破壞性檢測，就沒有產(chǎn)品可供銷售了，這違背了我們研究的本來目的。

2、還有一些研究對象，組成其整體的個體是無限多的，客觀上對全部個體進(jìn)行觀察和檢驗(yàn)是根本不可能的。如研究海水中微生物的情況時，不可能將全部海水都裝入試管中；分析魚池中全部活魚的重量與長度時，不能將池水抽干、逐條過秤等。因此，只能用隨機(jī)取樣統(tǒng)計(jì)推斷的方法。

3、有些情況對全部個體逐一研究、檢測是可以的，但需要付出非常多的財(cái)力、物力和時間。如自動化流水作業(yè)的生產(chǎn)過程，對每個產(chǎn)品進(jìn)行檢測需要停機(jī)等。因此，我們也只能依賴于抽樣檢驗(yàn)和調(diào)查，分析樣本后對整體做出判斷。

4、由于整體的不均勻性和樣本的隨機(jī)性，利用分析樣本得到的數(shù)據(jù)來推斷總體的情況必然會產(chǎn)生偏差。但是，在大多數(shù)情況下這種估計(jì)誤差的存在是合理的，也是可以容忍的。因?yàn)椴煌膯栴}有不同的精度要求，并不是所有問題都需要一個絕對準(zhǔn)確的估量，也不是一切問題都能得到一個非常精確的結(jié)果，所以統(tǒng)計(jì)推斷是不可缺少的研究手段。

3.統(tǒng)計(jì)推斷的兩類錯誤

人們總是希望不犯錯誤，但是在統(tǒng)計(jì)推斷過程中不犯錯誤是不可能的。由于總體的不均勻性和樣本的隨機(jī)性，統(tǒng)計(jì)推斷必然存在風(fēng)險(錯誤)。假設(shè)有一批未知質(zhì)量狀況的產(chǎn)品，現(xiàn)在隨機(jī)抽取其中的一個樣本，通過檢驗(yàn)、分析樣本的質(zhì)量狀況，來推斷整批產(chǎn)品的質(zhì)量好壞，則可能出現(xiàn)如表3所示的四種情況。

統(tǒng)計(jì)推斷

A、假定這批產(chǎn)品質(zhì)量是好的，通過檢驗(yàn)樣本發(fā)現(xiàn)樣本質(zhì)量也是好的，則推斷該批產(chǎn)品質(zhì)量好而決定接收。顯然，這個統(tǒng)計(jì)推斷是完全正確的。B、假定這批產(chǎn)品質(zhì)量不好，通過檢驗(yàn)發(fā)現(xiàn)樣本質(zhì)量不好，則推斷該批產(chǎn)品質(zhì)量不好而拒收。該統(tǒng)計(jì)推斷結(jié)論也是合理的。C、如果該批產(chǎn)品質(zhì)量是好的，而通過檢驗(yàn)樣本發(fā)現(xiàn)樣本質(zhì)量是壞的，則推斷該批產(chǎn)品質(zhì)量不好而拒收，就犯了“棄真”的錯誤，習(xí)慣上把它稱做第Ⅰ類錯誤。D、如果該批產(chǎn)品質(zhì)量不好，通過檢驗(yàn)樣本發(fā)現(xiàn)樣本質(zhì)量是好的，則推斷該批產(chǎn)品質(zhì)量好而予以接收，則犯了“取偽”的錯誤，通常將其稱做第Ⅱ類錯誤。

犯錯誤就會造成損失，就會發(fā)生預(yù)測失誤、判斷失誤，就會導(dǎo)致不希望結(jié)果的發(fā)生。在統(tǒng)計(jì)推斷過程中上述兩類錯誤總是此漲彼消不可避免的，我們的原則是控制兩類錯誤帶來的損失最小且已知。

在不同的統(tǒng)計(jì)推斷過程中，對上述兩類錯誤有著不同的描述。在用控制圖進(jìn)行統(tǒng)計(jì)過程控制中，第Ⅰ類錯誤叫“虛發(fā)警報”，即生產(chǎn)正常而點(diǎn)子偶然超出控制界限，依此就判異而犯“棄真”錯誤；第Ⅱ類錯誤叫“漏發(fā)警報”，即過程已經(jīng)異常，有部分點(diǎn)子仍位于控制界限內(nèi)。依此判過程正常而犯“取偽”錯誤。在抽樣檢驗(yàn)過程中，第Ⅰ類錯誤為生產(chǎn)方風(fēng)險，即對于給定的抽樣方案，當(dāng)質(zhì)量水平為某一指定的可接收質(zhì)量時被拒收的概率，此時生產(chǎn)方遭受損失；第Ⅱ類錯誤為使用方風(fēng)險，即對于給定的抽樣方案，當(dāng)質(zhì)量水平為某一指定的不滿意質(zhì)量時被接收的概率，此時使用方承受損失。在假設(shè)檢驗(yàn)過程中，犯兩類錯誤的情況如表4。

統(tǒng)計(jì)推斷

當(dāng)原假設(shè) $H 0$ 成立時，由于樣本觀察值落人拒絕域W中而誤認(rèn)為 $H 0$ 不成立，犯“棄真”錯誤；當(dāng)原假設(shè) $H 0$ 實(shí)際上不成立，由于樣本觀察值未落人拒絕域W而誤認(rèn)為 $H 0$ 成立，犯“取偽”錯誤。

4.統(tǒng)計(jì)推斷提高準(zhǔn)確性的途徑

個體是總體的一部分，局部的特性能反映全局的特點(diǎn)，但是，由于總體的不均勻性和樣本的隨機(jī)性，又使得樣本不能精確地反映總體。因此，抽取部分個體經(jīng)分析得出有關(guān)總體的結(jié)論存在著差錯和不可靠。從理論上講有兩種途徑可以消除和減少這種差錯。其一，使總體最大限度地均勻?？傮w是我們要研究的未知事物，我們往往不可能改變他的均勻性，當(dāng)能夠使其達(dá)到理想的均勻時，已經(jīng)完全掌握了它，沒有研究的必要了。其二，采取適當(dāng)?shù)某闃臃椒ù_保抽樣的“代表性”，可有效地控制和提高統(tǒng)計(jì)推斷的可靠性和正確性。

隨機(jī)抽樣的方法很多，常用的有：

1、簡單隨機(jī)抽樣

簡單隨機(jī)抽樣，是指抽樣過程應(yīng)獨(dú)立進(jìn)行并且總體中每個個體被抽到的機(jī)會均等。隨機(jī)抽樣不是隨便抽取，隨便抽取容易受到個人好惡的影響。為實(shí)現(xiàn)隨機(jī)化，可采取抽簽、擲隨機(jī)數(shù)骰子或查隨機(jī)數(shù)值表等辦法。如從100件產(chǎn)品中隨機(jī)抽取l0件組成樣本，可以把這100件產(chǎn)品從l開始編號直到100號，然后用抓鬮的辦法任意抽出l0個編號，由這l0個編號代表的產(chǎn)品組成樣本。此種抽樣方法的優(yōu)點(diǎn)是抽樣誤差小，缺點(diǎn)是手續(xù)繁雜。在實(shí)踐中真正做到每個個體被抽到的機(jī)會相等是不容易的。

2、周期系統(tǒng)抽樣

周期系統(tǒng)抽樣，又叫等距抽樣或機(jī)械抽樣，即將總體按順序編號，用抽簽或查隨機(jī)數(shù)值表的方法確定首件，進(jìn)而按等距原則依次抽取樣本。如從120個零件中取五個做樣本，先按生產(chǎn)順序給產(chǎn)品編號，用簡單隨機(jī)抽樣法確定首件，然后按每隔24(由120÷5=24得)個號碼抽取一個，共抽取五個組成樣本。這種方法特別適用于流水線上取樣，操作簡便，實(shí)施起來不易出現(xiàn)差錯。但抽樣起點(diǎn)一經(jīng)確定，整個樣本就完全固定。對總體質(zhì)量特性含有某種周期性變化，而當(dāng)抽樣間隔恰好與質(zhì)量特性變化周期吻合時，就可能得到一個偏差很大的樣本。

3、分層抽樣法

分層抽樣法，即從一個可以分成不同子總體的總體中，按規(guī)定比例從不同層中隨機(jī)抽取個體的方法。當(dāng)不同設(shè)備、不同環(huán)境生產(chǎn)同一種產(chǎn)品時，由于條件差別產(chǎn)品質(zhì)量可能有較大差異，為了使所抽取的樣本具有代表性，可以將不同條件下生產(chǎn)的產(chǎn)品組成組，使同一組內(nèi)產(chǎn)品質(zhì)量均勻，然后在各組內(nèi)按比例隨機(jī)抽取樣品合成一個樣本。這種抽樣方法得到的樣本代表性比較好，抽樣誤差較小，缺點(diǎn)是抽樣手續(xù)較繁，常用于產(chǎn)品質(zhì)量檢驗(yàn)。

4、整群抽樣法

這種方法是先將總體按一定方式分成多個群，然后隨機(jī)地抽取若干群并由這些群中的所有個體組成樣本。如按照生產(chǎn)過程將1000個零件分別裝入2O個箱中，每箱5O個，然后隨機(jī)抽取一箱，此箱中5O個零件組成樣本。這種抽樣方法實(shí)施方便，但樣本來自個別群體而不能均勻分布在總體中，因而代表性差，抽樣誤差較大。

評論 | 0條評論

評論

經(jīng)理人分享

統(tǒng)計(jì)推斷

目錄

1.什么是統(tǒng)計(jì)推斷

2.統(tǒng)計(jì)推斷的必要性

3.統(tǒng)計(jì)推斷的兩類錯誤

4.統(tǒng)計(jì)推斷提高準(zhǔn)確性的途徑