登錄

知識組織系統(tǒng)

百科 > 知識管理工具 > 知識組織系統(tǒng)

1.什么是知識組織系統(tǒng)

知識組織系統(tǒng)是對人類知識結(jié)構(gòu)進(jìn)行表達(dá)和有組織地闡述的各種語義工具( Semantic Tools) 的統(tǒng)稱,包括分類法、敘詞表、語義網(wǎng)絡(luò)、概念本體以及其它情報檢索語言與標(biāo)引語言。[1]曾蕾將知識組織系統(tǒng)分為三大類型,分別是詞單(term lists),包括詞匯/字典、地名表、規(guī)范文檔、術(shù)語表等;分類與大致歸類(Classification&Categorization),包括分類法、知識分類表、大致歸類類表、標(biāo)題表等;關(guān)聯(lián)組織(Relationship Groups),包括本體、語義網(wǎng)絡(luò)、概念地圖、敘詞表等(見圖)。

Image:知識組織系統(tǒng).jpg

2.知識組織系統(tǒng)的發(fā)展[2]

在目前情況下,知識組織系統(tǒng)除了對以上分類主題一體化、形式化本體和大眾分類等進(jìn)行研究外,主要朝以下兩個方向發(fā)展:

1.受控語言與自然語言的融合研究

人們普遍認(rèn)為,自然語言中的術(shù)語專指性高,有助于表達(dá)獨(dú)特的檢索需求和提高查準(zhǔn)率。同時,網(wǎng)絡(luò)用戶在進(jìn)行網(wǎng)絡(luò)搜索時也傾向于使用術(shù)語進(jìn)行搜索。因此,對術(shù)語的研究可以成為自然語言與受控語言融合的突破口。術(shù)語的特征是規(guī)模較為穩(wěn)定,增長和更新的速度較之日常生活用詞匯要慢得多。有研究表明,在網(wǎng)絡(luò)環(huán)境下使用術(shù)語做提問詞并以此改善查準(zhǔn)率是可行的。Google也用術(shù)語來優(yōu)化檢索和縮小檢索結(jié)果的范圍,提高其查準(zhǔn)率。

但術(shù)語僅為語義檢索提供詞匯基礎(chǔ),而要真正實(shí)現(xiàn)語義檢索,還需要有功能更為強(qiáng)大的邏輯工具。本體及其他類似的邏輯工具的引入,不僅在傳統(tǒng)的知識組織工具的改造方面,而且也在支持自然語言檢索和促進(jìn)受控語言與自然語言融合方面都有可能起到重要作用。另外還應(yīng)看到,解決自然語言與受控語言的融合問題,需要深入研究邏輯學(xué)和語言學(xué),借鑒和引進(jìn)這兩個學(xué)科的研究方法和成果,深入分析受控語言的詞匯、句法結(jié)構(gòu)和語義結(jié)構(gòu)。

2.多語言詞表構(gòu)建研究

互聯(lián)網(wǎng)使各種語言的資源充斥整個網(wǎng)絡(luò)。因此,應(yīng)用多語種詞表來實(shí)現(xiàn)跨語言檢索已成為網(wǎng)絡(luò)時代的一種需求。2005年IFLA起草的《多語言敘詞表指南》,對于建立多語言敘詞表具有指導(dǎo)和促進(jìn)作用?!抖嗾Z言敘詞表指南》介紹的三種多語種敘詞表的構(gòu)建方法是:①從一種語言開始創(chuàng)建新的敘詞表,然后增加其他語言;②合并現(xiàn)有敘詞表(可合并兩種或多種現(xiàn)有的敘詞表從而成為一種新的多語言檢索語言,或?qū)F(xiàn)有的敘詞表相互鏈接);③將一種敘詞表翻譯成一種或其他語言的敘詞表。

多語種敘詞表的運(yùn)用擴(kuò)大了網(wǎng)絡(luò)敘詞表的使用范圍,使敘詞表向國際化方向發(fā)展。目前正在進(jìn)行的多語種詞表項目有:國際糧農(nóng)組織FAO的多語種農(nóng)業(yè)敘詞表AGROVOC、歐洲的GEMET和Eurovoc、Mer-imee,以及荷蘭的MACs等。

3.知識組織系統(tǒng)的互操作

知識組織系統(tǒng)互操作是指不同知識組織系統(tǒng)之間的兼容互換。就像元數(shù)據(jù)標(biāo)準(zhǔn)的互操作既可將性質(zhì)相同的元數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行映射對照,也可將性質(zhì)不同的元數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行映射對照一樣,知識組織系統(tǒng)的資源組織互操作既包括不同分類法之間或不同主題詞表之間的互操作,也包括分類法與主題詞表之間的互操作。知識組織系統(tǒng)間這方面的互操作主要通過派生法、翻譯法、系列化分類表或詞表、衛(wèi)星詞表法、直接映射、共現(xiàn)映射、中介詞典、數(shù)據(jù)庫鏈接以及宏詞匯的模式與方法來實(shí)現(xiàn)。

知識組織系統(tǒng)互操作是實(shí)現(xiàn)分布式資源集成檢索以及交叉瀏覽的有效方法。因此,互操作成為知識組織系統(tǒng)領(lǐng)域重點(diǎn)研究的主攻技術(shù),相關(guān)的研究項目有歐盟的DESIREII,歐洲的HILT和Renardus,以及美國國家醫(yī)學(xué)圖書館的UMLS等。

在分布式網(wǎng)絡(luò)環(huán)境下,無論是數(shù)字圖書館等學(xué)術(shù)應(yīng)用系統(tǒng)還是企業(yè)的商用信息系統(tǒng),都在一定程度上面臨著系統(tǒng)異構(gòu)、語法異構(gòu)、模式異構(gòu)和語義異構(gòu)等問題。近年來,國外學(xué)者關(guān)于應(yīng)用本體解決信息系統(tǒng)問題的研究主要圍繞方法層面:探尋基于本體的有效方法,解決特定領(lǐng)域的異構(gòu)問題。所采用的方法主要為本體與代理結(jié)合的方法、本體間映射的方法。

如果把主題詞表和分類表看成是傳統(tǒng)知識組織系統(tǒng),那么知識組織系統(tǒng)的互操作除了解決傳統(tǒng)知識組織系統(tǒng)間的互操作以及本體問的互操作問題外,還要解決傳統(tǒng)知識組織系統(tǒng)與本體以及大眾分類與本體間的互操作問題。

評論  |   0條評論