知識組織系統(tǒng)互操作
1.知識組織系統(tǒng)互操作的含義
從宏觀上說,知識組織系統(tǒng)的互操作是當(dāng)前知識組織工具發(fā)展的重要特征,即從單一知識組織系統(tǒng)的獨(dú)立建設(shè)向各類知識組織系統(tǒng)的整合方向發(fā)展、從各學(xué)科的局部建設(shè)向跨領(lǐng)域的集成方向發(fā)展、從單一語種的構(gòu)建向多語種對照和映射的方向發(fā)展。即便是傳統(tǒng)知識組織系統(tǒng),也存在由于版本升級、不同語種對照和不同類型整合(如分類主題一體化等)等問題需要相應(yīng)的知識組織系統(tǒng)管理軟件支持和解決。因此,互操作的支持能力成為評價(jià)知識組織系統(tǒng)管理軟件的一項(xiàng)重要指標(biāo)。
如前所述,互操作是指兩個或多個系統(tǒng)相互使用已被交換的數(shù)據(jù)/信息的能力,而知識組織系統(tǒng)的互操作就是指不同知識組織系統(tǒng)之間的兼容互換。當(dāng)前,各種數(shù)字圖書館、主題網(wǎng)關(guān)(學(xué)科信息門戶)以及搜索引擎等成為業(yè)界研究的熱點(diǎn)和建設(shè)的重點(diǎn),而如何通過異質(zhì)知識組織系統(tǒng)間的互操作,為用戶提供跨庫、跨系統(tǒng)、跨語言的瀏覽與檢索是圖書館界和信息界正在重點(diǎn)關(guān)注的一個熱點(diǎn)課題。即多類型、多語言的知識組織系統(tǒng)之間的互操作,是實(shí)現(xiàn)分布式信息資源系統(tǒng)交叉瀏覽和集成檢索的有效方法,也是目前知識組織系統(tǒng)建設(shè)的主要內(nèi)容。
資源組織要實(shí)現(xiàn)知識組織系統(tǒng)間的互操作,就是要找到某種方法,使具有不同標(biāo)識、結(jié)構(gòu)、載體的分類表或主題詞表或形式化本體等的成分建立聯(lián)系,用戶只用一種檢索語言或直接使用自然語言就可實(shí)現(xiàn)聯(lián)網(wǎng)環(huán)境下的跨數(shù)據(jù)庫或信息系統(tǒng)檢索。而要實(shí)現(xiàn)這一目標(biāo)就必須在信息描述、檢索、對象交換與檢索協(xié)議等方面取得突破性進(jìn)展。需要解決的問題另還包括元數(shù)據(jù)的定義和通過文本或多媒體數(shù)字對象等抽取元數(shù)據(jù),數(shù)字對象的特征描述計(jì)算,具有不同語義的異構(gòu)資源庫的整合,信息的聚類和自動分類、自動排序、分級算法等。
2.知識組織系統(tǒng)互操作的層面[1]
國內(nèi)外學(xué)術(shù)界一直比較重視知識組織系統(tǒng)問的互操作研究,實(shí)施了許多積極而有成效的研究計(jì)劃,而且一些研究成果也已在實(shí)踐中得到應(yīng)用。據(jù)司莉所做的調(diào)查,國內(nèi)外已開展的數(shù)十項(xiàng)知識組織系統(tǒng)的互操作研究計(jì)劃大致可以歸為以下三類:一類是相同結(jié)構(gòu)間的互操作研究,包括標(biāo)題法之間、敘詞表之間以及分類法之間的互操作研究。其中,敘詞表之間和分類法之間的互操作研究占這類互操作研究的八成以上。第二類是不同結(jié)構(gòu)間的互操作研究,包括兩種知識組織系統(tǒng)(比如敘詞表與分類法、分類法與標(biāo)題表)以及三種以上知識組織系統(tǒng)問的互操作研究。對多種知識組織系統(tǒng)間的互操作研究已成為今后研究的重點(diǎn),也是互操作領(lǐng)域研究的發(fā)展趨勢。第三類是涉及兩種語言以上的互操作研究,約有十多項(xiàng)。這一方面是各國文化的發(fā)展、不同文化之間的交流和融合發(fā)展的結(jié)果,另一方面也說明知識組織系統(tǒng)的互操作研究國際化和全球化的程度在不斷加深。語言障礙和異構(gòu)系統(tǒng)是用戶利用知識信息的最大阻礙,因此互操作也成為網(wǎng)絡(luò)知識組織系統(tǒng)(NKOS)重點(diǎn)討論的一項(xiàng)關(guān)鍵技術(shù)。其中,跨語言的互操作在美國和歐洲尤其受到重視,美國數(shù)字圖書館先導(dǎo)計(jì)劃(DigitalLibrary Initiative)中有許多項(xiàng)目就是解決語義互操作問題的。例如Illinois大學(xué)主持的項(xiàng)目中關(guān)于概念空間與分類地圖的研究,伯克利(Berkeley)大學(xué)主持的項(xiàng)目中對于消除文字歧義的研究,卡內(nèi)基梅隆(CarnegieMellon)大學(xué)主持的項(xiàng)目中對于語音識別的研究以及加州大學(xué)圣塔巴巴拉分校關(guān)于圖像的分割與聚類的研究,主要集中于人工智能、統(tǒng)計(jì)規(guī)律識別技術(shù)等,這些都屬于語義研究或語義互操作研究范疇。歐洲的相關(guān)研究項(xiàng)目有Renardus、MACS、Merimee等,甚至嘗試自動建立中、英文詞表之間的映射。我國也有一些關(guān)于雙語數(shù)字圖書館知識組織系統(tǒng)互操作的研究,例如《漢語主題詞表》與LCSH、本體之間的轉(zhuǎn)換研究、《中圖法》與DDC類目設(shè)置的比較、與DDC對照系統(tǒng)的研制等。
異構(gòu)系統(tǒng)間的互操作的目標(biāo)是實(shí)現(xiàn)不同系統(tǒng)間的知識交換、共享和重用。這方面需要解決的問題除了跨語言、跨文化互操作(未來的數(shù)字圖書館系統(tǒng)將是聯(lián)邦數(shù)字圖書館。即建立全球范圍的數(shù)字圖書館系統(tǒng),需要解決跨語言、跨文化的互操作問題,其中包括比較復(fù)雜的語言翻譯問題)問題外,還有不同本體間的互操作(本體作為語義萬維網(wǎng)建設(shè)的核心,為數(shù)字圖書館系統(tǒng)的語義互操作提供了解決方案,但其本身也存在著異構(gòu)性,因此不同本體間的互操作也是數(shù)字圖書館系統(tǒng)互操作的一個方面),以及各類知識組織系統(tǒng)安全性問題。開展多語種知識組織系統(tǒng)互操作的研究,將有助于世界范圍內(nèi)信息資源的整合與共享,具有很大的現(xiàn)實(shí)意義。與國外互操作研究相比,我國這方面的研究一是起步較晚,二是研究的項(xiàng)目數(shù)量比較少,因此相應(yīng)的實(shí)踐成果也較少。目前已經(jīng)開展的研究項(xiàng)目主要包括中醫(yī)藥一體化語言系統(tǒng)、AGROVOC詞表的中文翻譯、《中圖法》與DDC映射系統(tǒng)、教育集成詞庫構(gòu)建系統(tǒng)、醫(yī)學(xué)分類主題一體化系統(tǒng)建設(shè)、漢語科技詞系統(tǒng)等。而涉及分類法與主題法之間的互操作的技術(shù)方式較為單一,主要為對照索引式的分類主題一體化詞表。
綜合國內(nèi)外知識組織系統(tǒng)的研究,我們將各種類型的知識組織系統(tǒng)粗略劃分為兩類,一類是傳統(tǒng)知識組織系統(tǒng),包括術(shù)語表、分類表、類目表、標(biāo)題表、敘詞表及其他情報(bào)檢索語言與標(biāo)引語言等;另一類是以形式化本體為代表的新型知識組織系統(tǒng)。與此相應(yīng)同時也是為了論述的方便,本節(jié)將知識組織系統(tǒng)互操作也大致分為兩類,一類是傳統(tǒng)知識組織系統(tǒng)間的互操作,另一類本體間的互操作。