卡方檢驗
1.什么是卡方檢驗
卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。它屬于非參數檢驗的范疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變量的關聯性分析。其根本思想就是在于比較理論頻數和實際頻數的吻合程度或擬合優(yōu)度問題。
它在分類資料統(tǒng)計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。
2.卡方檢驗的基本思想
在分類資料統(tǒng)計分析中我們常會遇到這樣的資料,如兩組大白鼠在不同致癌劑作用下的發(fā)癌率如下表,問兩組發(fā)癌率有無差別?
處理 | 發(fā)癌數 | 未發(fā)癌數 | 合計 | 發(fā)癌率% |
---|---|---|---|---|
甲組 | 52 | 19 | 71 | 73.24 |
乙組 | 39 | 3 | 42 | 92.86 |
合計 | 91 | 22 | 113 | 80.33 |
52、19、39、3是表中最基本的數據,因此,上表資料又被稱之為四格表資料??ǚ綑z驗的統(tǒng)計量是卡方值,它是每個格子實際頻數A與理論頻數T差值平方與理論頻數之比的累計和。每個格子中的理論頻數T是在假定兩組的發(fā)癌率相等(均等于兩組合計的發(fā)癌率)的情況下計算出來的,如第一行第一列的理論頻數為71*91/113=57.18,故卡方值越大,說明實際頻數與理論頻數的差別越明顯,兩組發(fā)癌率不同的可能性越大。
評論 | 0條評論
評論