粗糙集
1.什么是粗糙集
粗糙集是一種處理不精確、不確定和不完全數(shù)據(jù)的新的數(shù)學(xué)方法。它可以通過對數(shù)據(jù)的分析和推理來發(fā)現(xiàn)隱含的知識、揭示潛在的規(guī)律。在粗集理論中,知識被認(rèn)為是一種分類能力。其核心是利用等價(jià)關(guān)系來對對象集合進(jìn)行劃分。
粗糙集理論提出了知識的約簡方法,是在保留基本知識(信息),同時(shí)保證對象的分類能力不變的基礎(chǔ)上,消除重復(fù)、冗余的屬性和屬性值,實(shí)現(xiàn)對知識的壓縮和再提煉。其操作步驟:(1)通過對條件屬性的約簡,即從決策表中消去某些列;(2)消去重復(fù)的行和屬性的冗余值
2.粗糙集的特點(diǎn)
粗糙集最主要的特點(diǎn)是:它無需提供對知識或數(shù)據(jù)的主觀評價(jià),僅根據(jù)觀測數(shù)據(jù)就能達(dá)到刪除冗余信息,比較不完備知識的程度-粗糙度,界定屬性間的依賴性和重要性的目的。
3.粗糙集的基本概念
粗糙集的基本概念有:
- (1)信息系統(tǒng)。一般地,一個(gè)知識表達(dá)系統(tǒng)或信息系統(tǒng)可以表達(dá)成, 式中,為論域,它是全體樣本的集合;為屬性集合,其中子集是條件屬性集,反映對象的特征,D為決策屬性集,反映對象的類別;為屬性集合,表示屬性r的取值范圍;為一個(gè)信息函數(shù),用于確定U中每一個(gè)對象的屬性值,即任一。
- (2)不可分辨關(guān)系。當(dāng)兩個(gè)對象由相同的屬性來描述時(shí),這兩個(gè)對象在該系統(tǒng)中被歸于同一類,它們的關(guān)系稱之為不可分辨關(guān)系,即對于任一屬性子集,如果對象,,,當(dāng)且僅當(dāng)時(shí),和是不可分辨關(guān)系,不可分辨關(guān)系簡稱等價(jià)關(guān)系。
- (3)下近似集與上近似集。下近似集定義為:根據(jù)現(xiàn)有知識R,判斷U中所有肯定屬于X的對象所組成的集合,即,式中,表示等價(jià)關(guān)系R下包含關(guān)系x的等價(jià)類;上近似集定義為:根據(jù)現(xiàn)有知識R,判斷U中一定屬于和可能屬于X的對象所組成的集合。
4.粗糙集與模糊集比較
粗糙集與模糊集都能處理不完備( imperfect) 數(shù)據(jù), 但方法不同, 模糊集注重描述信息的含糊(vagueness) 程度, 粗糙集則強(qiáng)調(diào)數(shù)據(jù)的不可辨別( indiscern ib ility) , 不精確( imp recision) 和模棱兩可 (am b igu ity). 使用圖像處理中的語言來作比喻, 當(dāng)論述圖像的清晰程度時(shí), 粗糙集強(qiáng)調(diào)組成圖像象素的大小, 而模糊集則強(qiáng)調(diào)象素存在不同的灰度. 粗糙集研究的是不同類中的對象組成的集合之間的關(guān)系, 重在分類; 模糊集研究的是屬于同一類的不同對象的隸屬的關(guān)系,重在隸屬的程度. 因此粗糙集和模糊集是兩種不同的理論, 但又不是相互對立的, 它們在處理不完善數(shù)據(jù)方面可以互為補(bǔ)充.