判別分析
百科 > 判別分析
1.什么是判別分析
判別分析產生于20世紀30年代,是利用已知類別的樣本建立判別模型,為未知類別的樣本判別的一種統(tǒng)計方法。近年來,判別分析在自然科學、社會學及經濟管理學科中都有廣泛的應用。判別分析的特點是根據已掌握的、歷史上每個類別的若干樣本的數據信息,總結出客觀事物分類的規(guī)律性,建立判別公式和判別準則。當遇到新的樣本點時,只要根據總結出來的判別公式和判別準則,就能判別該樣本點所屬的類別。判別分析按照判別的組數來區(qū)分,可以分為兩組判別分析和多組判別分析。
2.判別分析的方法
判別分析(Discriminatory Analysis)的任務是根據已掌握的1批分類明確的樣品,建立較好的判別函數,使產生錯判的事例最少,進而對給定的1個新樣品,判斷它來自哪個總體。
根據資料的性質,分為定性資料的判別分析和定量資料的判別分析;采用不同的判別準則,又有費歇、貝葉斯、距離等判別方法。
費歇(FISHER)判別思想是投影,使多維問題簡化為一維問題來處理。選擇一個適當的投影軸,使所有的樣品點都投影到這個軸上得到一個投影值。對這個投影軸的方向的要求是:使每一類內的投影值所形成的類內離差盡可能小,而不同類間的投影值所形成的類間離差盡可能大。
貝葉斯(BAYES)判別思想是根據先驗概率求出后驗概率,并依據后驗概率分布作出統(tǒng)計推斷。所謂先驗概率,就是用概率來描述人們事先對所研究的對象的認識的程度;所謂后驗概率,就是根據具體資料、先驗概率、特定的判別規(guī)則所計算出來的概率。它是對先驗概率修正后的結果。
距離判別思想是根據各樣品與各母體之間的距離遠近作出判別。即根據資料建立關于各母體的距離判別函數式,將各樣品數據逐一代入計算,得出各樣品與各母體之間的距離值,判樣品屬于距離值最小的那個母體。
評論 | 0條評論
評論