知識(shí)構(gòu)建
目錄
1.知識(shí)構(gòu)建的基本原理
知識(shí)構(gòu)建的基本原理不僅表現(xiàn)在知識(shí)構(gòu)建需要一定的前提條件,而且表現(xiàn)在其知識(shí)狀態(tài)要發(fā)生由知識(shí)元→知識(shí)單元→知識(shí)結(jié)構(gòu)→知識(shí)空間的演變,還表現(xiàn)在其應(yīng)遵循的基本原則:知識(shí)元抽取原則、知識(shí)單元序化原則、知識(shí)結(jié)構(gòu)展示原則、知識(shí)空間優(yōu)化原則上。
2.知識(shí)構(gòu)建的支撐技術(shù)
知識(shí)技術(shù)是用于知識(shí)采集、模型化、重用、檢索、提供和維護(hù)整個(gè)知識(shí)生命周期的新一代智能信息技術(shù),也是實(shí)現(xiàn)以語義網(wǎng)為核心的互聯(lián)網(wǎng)第三次革命的關(guān)鍵技術(shù)。從本質(zhì)上說,知識(shí)技術(shù)是對(duì)信息進(jìn)行理解的智能技術(shù),其中本體技術(shù)是其核心?,F(xiàn)在的知識(shí)技術(shù)包括語義Web技術(shù)、概念本體、網(wǎng)格技術(shù)、知識(shí)地圖技術(shù)、基本代理技術(shù)等,正在發(fā)展的知識(shí)技術(shù)有虛擬協(xié)同和聯(lián)合、互聯(lián)網(wǎng)推理服務(wù)、多語言實(shí)時(shí)自然語言處理、泛在計(jì)算基礎(chǔ)設(shè)施和網(wǎng)格計(jì)算。知識(shí)技術(shù)面臨著概念本體的建造和管理、內(nèi)容自動(dòng)化、提供服務(wù)、語境捕獲和基本原理、起源和信托(provenanee and trust)、知識(shí)維護(hù)、社會(huì)、文化和組織問題。從研究目標(biāo)來看,知識(shí)技術(shù)可用于解決未來知識(shí)構(gòu)建(knowledge architecture,KA)中的知識(shí)采集、知識(shí)模型化、知識(shí)重用、知識(shí)檢索、知識(shí)提供和知識(shí)維護(hù)這6個(gè)挑戰(zhàn)??梢?知識(shí)技術(shù)為KA提供了支撐。
3.知識(shí)構(gòu)建過程中知識(shí)狀態(tài)的演變
知識(shí)元——KA的理想基元
信息源于物質(zhì)的抽象變換,知識(shí)源于智能對(duì)信息的認(rèn)知結(jié)果;信息和知識(shí)屬于兩個(gè)不同領(lǐng)域的實(shí)體,存在著依存和變換關(guān)系。實(shí)現(xiàn)信息向知識(shí)的轉(zhuǎn)化, 是KA的首要環(huán)節(jié)。
文本是信息和知識(shí)記錄的載體,文本的知識(shí)內(nèi)容是由一個(gè)個(gè)獨(dú)立的知識(shí)元素按其邏輯關(guān)系進(jìn)行組織排列的。這種獨(dú)立的知識(shí)元素人們稱之為知識(shí)元,邏輯依存關(guān)系稱為知識(shí)鏈。知識(shí)元是構(gòu)成知識(shí)結(jié)構(gòu)的最小獨(dú)立單元,用來表示一個(gè)個(gè)針對(duì)特定問題的解決方案,可以是概念、方法、規(guī)則、公理等數(shù)據(jù)或事實(shí),以及實(shí)例化的知識(shí)。
知識(shí)元的本體特征與認(rèn)知屬性更適合KA的需求。知識(shí)元可表示為:知識(shí)元=文本知識(shí)(本體論)+知識(shí)元語義概念(認(rèn)知論)。知識(shí)元的本體特征為資源描述和查詢提供了必須的元素,知識(shí)元采用規(guī)范的形式語言、精確的句法和明確定義的語義,對(duì)領(lǐng)域中的概念與概念、概念與實(shí)體、實(shí)體與實(shí)體之間的關(guān)系進(jìn)行預(yù)先標(biāo)注,有效減少了系統(tǒng)內(nèi)各主體領(lǐng)域中概念和邏輯關(guān)系可能造成的誤解和歧義,具有良好的概念層次結(jié)構(gòu)和對(duì)邏輯推理的支持;知識(shí)元的認(rèn)知屬性使信息檢索從字面匹配深入到知識(shí)元的層次,提高了檢索效率,在信息源的知識(shí)標(biāo)引和檢索中具有重要意義。
知識(shí)元的獨(dú)立性、拓?fù)湫院玩溄有允钦Z義網(wǎng)格環(huán)境下KA的重要起點(diǎn)。利用知識(shí)元這些特性,語義網(wǎng)格便可在知識(shí)結(jié)構(gòu)、知識(shí)單元、知識(shí)元之間,通過知識(shí)鏈和語義鏈形成知識(shí)鏈網(wǎng)絡(luò)和語義鏈網(wǎng)絡(luò),進(jìn)而構(gòu)畫出知識(shí)地圖,為知識(shí)的語義檢索提供了途徑??梢?基于知識(shí)元鏈接的知識(shí)網(wǎng)絡(luò)與語義網(wǎng)絡(luò)不僅為KA建立了知識(shí)地圖,而且實(shí)現(xiàn)了知識(shí)組織系統(tǒng)以知識(shí)元為基元的語義互聯(lián)推理體系結(jié)構(gòu),消除網(wǎng)絡(luò)資源孤島,為在語義網(wǎng)格中對(duì)知識(shí)的動(dòng)態(tài)檢索與利用建立了知識(shí)導(dǎo)航。
知識(shí)元內(nèi)容的單一性與獨(dú)立性,便于KA的知識(shí)組織與檢索。內(nèi)容單一、獨(dú)立的知識(shí)元,容易選擇與之相適應(yīng)的最佳存儲(chǔ)和查詢,便于知識(shí)庫的構(gòu)建與檢索,便于用戶直接查詢知識(shí)元,組合知識(shí)元,改善自己的知識(shí)結(jié)構(gòu),從而加快知識(shí)創(chuàng)新速度。
上述三方面知識(shí)元優(yōu)勢(shì)的有機(jī)結(jié)合,不但保證了將知識(shí)元作為KA的起點(diǎn),既符合知識(shí)檢索的要求,又遵從客觀知識(shí)結(jié)構(gòu)的本來面目;而且保證了基于知識(shí)元的知識(shí)組織體系的整體性和關(guān)聯(lián)性,為實(shí)現(xiàn)KA由等級(jí)式向網(wǎng)絡(luò)式轉(zhuǎn)變提供了理論和技術(shù)可行性,使知識(shí)元成為KA的理想基元。
知識(shí)單元——KA的基本對(duì)象
文獻(xiàn)單元是有形的物理單元,信息單元是表現(xiàn)文獻(xiàn)屬性的特征單元,而知識(shí)單元?jiǎng)t是源于文獻(xiàn)單元和信息單元的知識(shí)內(nèi)容單元。若將每篇文獻(xiàn)看成是人類知識(shí)系統(tǒng)中的一個(gè)知識(shí)單元,知識(shí)單元與知識(shí)系統(tǒng)就組成了個(gè)性知識(shí)與共性知識(shí)系統(tǒng)。個(gè)性知識(shí)體現(xiàn)在知識(shí)的創(chuàng)新上,共性知識(shí)系統(tǒng)則表現(xiàn)在知識(shí)的完整性上。于是,知識(shí)系統(tǒng)={知識(shí)單元1,知識(shí)單元2,…,知識(shí)單元n},知識(shí)單元={知識(shí)元1,知識(shí)元2,…,知識(shí)元n}。
隨著人類知識(shí)管理的目標(biāo)從知識(shí)載體和知識(shí)屬性特征過渡到知識(shí)內(nèi)容本身,知識(shí)管理的對(duì)象也經(jīng)歷了從文獻(xiàn)單元到信息單元既而到知識(shí)單元的演進(jìn)過程。所以,出于對(duì)知識(shí)管理優(yōu)化的KA,必將知識(shí)單元視為自己構(gòu)建的基本對(duì)象。為此,文獻(xiàn)[7]對(duì)文本單元向知識(shí)單元轉(zhuǎn)化進(jìn)行了研究,并提出了基于本體的 OTKTS(Ontology-based Text Knowledge TransformSystem)系統(tǒng)模型。
知識(shí)結(jié)構(gòu)——KA的內(nèi)容主體
在KA活動(dòng)中,知識(shí)建筑師(Knowledge Architects)需要在對(duì)知識(shí)內(nèi)容、用戶的知識(shí)需求以及知識(shí)環(huán)境理解的基礎(chǔ)上,對(duì)知識(shí)集合中的知識(shí)單元進(jìn)行知識(shí)元抽取、分解,并對(duì)知識(shí)單元及其知識(shí)元進(jìn)行本體語義標(biāo)注,形成知識(shí)單元之間及其不同知識(shí)元之間的語義關(guān)聯(lián),從而建立起知識(shí)固有的層次結(jié)構(gòu)關(guān)系,使知識(shí)體系成為有序的關(guān)聯(lián)整體,這就是知識(shí)結(jié)構(gòu)。它是知識(shí)系統(tǒng)存儲(chǔ)知識(shí)及其進(jìn)行交流的方式和渠道。因此,KA必將知識(shí)結(jié)構(gòu)納入其知識(shí)空間設(shè)計(jì)的內(nèi)容主體。
知識(shí)空間——KA的實(shí)現(xiàn)目標(biāo)
網(wǎng)絡(luò)時(shí)代,KA更凸顯其空間特征。KA的任務(wù)就是要求知識(shí)建筑師們?cè)谥R(shí)空間規(guī)劃中,進(jìn)行知識(shí)界面設(shè)計(jì),建立知識(shí)結(jié)構(gòu)和知識(shí)路徑,并將知識(shí)結(jié)構(gòu)及其包含的知識(shí)內(nèi)容以科學(xué)的或藝術(shù)的方式在特定的知識(shí)空間中展示給用戶,使用戶易于發(fā)現(xiàn)和獲取所要的知識(shí)。可見,在KA過程中,不但要使信息向知識(shí)轉(zhuǎn)化,而且還要實(shí)現(xiàn)知識(shí)狀態(tài)由知識(shí)元→知識(shí)單元→知識(shí)結(jié)構(gòu)→知識(shí)空間的日益清晰化和可利用性遞進(jìn)。這就需要在空間中實(shí)現(xiàn)對(duì)知識(shí)的控制,使知識(shí)的空間分布合理化,建立知識(shí)存取的空間秩序,實(shí)現(xiàn)KA的目標(biāo)。
總之,KA的主要活動(dòng)是組織知識(shí)內(nèi)容、生成知識(shí)結(jié)構(gòu)和規(guī)范知識(shí)空間,直接目標(biāo)是建立一個(gè)清晰的、易于理解的知識(shí)空間結(jié)構(gòu),最后向用戶提供給一個(gè)良好的知識(shí)生態(tài)環(huán)境。因此,可以說KA的過程就是為知識(shí)單元生成一個(gè)合理的知識(shí)結(jié)構(gòu),并在特定的知識(shí)空間中展示這種知識(shí)結(jié)構(gòu)。
4.信息構(gòu)建和知識(shí)構(gòu)建的比較
兩者的相聯(lián)系之處在于:
1)信息構(gòu)建和知識(shí)構(gòu)建都是關(guān)注內(nèi)容組織問題的學(xué)問、解決共同的問題:即信息/知識(shí)——表達(dá)清楚化、組織的有序化、存儲(chǔ)的本體化。
2)信息構(gòu)建和知識(shí)構(gòu)建都建立在“以人為本”的思想基礎(chǔ)之上,關(guān)注非凡環(huán)境下的人所處的信息生態(tài),人的信息獲取和知識(shí)利用問題。
3)當(dāng)信息構(gòu)建的理念被用來整理組織內(nèi)部的數(shù)據(jù)和信息,讓信息便于發(fā)現(xiàn)和治理,以便創(chuàng)建知識(shí)時(shí),它是知識(shí)構(gòu)建的一個(gè)必不可少的基礎(chǔ)。
兩者的相異之處在于:
1)信息構(gòu)建目前已經(jīng)成為一個(gè)專有名詞,雖然人們對(duì)信息構(gòu)建這個(gè)學(xué)科領(lǐng)域所包括的內(nèi)容范圍還沒有確定清楚,但是它究竟已經(jīng)有了自己的核心領(lǐng)域和研究重點(diǎn),形成了一個(gè)基本穩(wěn)定的研究框架,有了專門的網(wǎng)站和研究社團(tuán)。而知識(shí)構(gòu)建還沒有完全成為一個(gè)專有名詞,還缺乏自己的研究核心、重點(diǎn)和框架。筆者通過搜索也還沒有發(fā)現(xiàn)專門的KA網(wǎng)站或者研究社團(tuán),只發(fā)現(xiàn)了一些公司所宣傳的、主要作為咨詢工具的知識(shí)構(gòu)建產(chǎn)品。知識(shí)構(gòu)建看起來與知識(shí)治理的學(xué)科領(lǐng)域知識(shí)有比較大的交叉。
2)信息和知識(shí)的差異決定了信息構(gòu)建與知識(shí)構(gòu)建的差異,信息構(gòu)建解決的是人們?nèi)绾伟l(fā)現(xiàn)信息和理解信息的問題,只需要回答人們所需要的信息的可能位置并更好地展示這些信息;知識(shí)構(gòu)建要解決提供給人們所處理事務(wù)時(shí)利用哪些知識(shí)的問題,回答如何去做。而這與背景條件、個(gè)人的差異、所處理的事務(wù)、要完成的任務(wù)有更加直接的關(guān)系,這種關(guān)系是內(nèi)在的而不是外在的或者表面的關(guān)聯(lián)。
3)比起信息構(gòu)建來,知識(shí)構(gòu)建所要建立的知識(shí)框架需要嵌入更多的、復(fù)雜的背景因素,知識(shí)構(gòu)建需要信息構(gòu)建的一些思路和方法,需要信息的組織系統(tǒng)、標(biāo)識(shí)系統(tǒng)、導(dǎo)航系統(tǒng)和搜索系統(tǒng)這樣的基礎(chǔ),但需要進(jìn)一步發(fā)展為知識(shí)組織、知識(shí)標(biāo)識(shí)、知識(shí)導(dǎo)航和知識(shí)搜索,它們與信息構(gòu)建的4個(gè)核心概念的差異就在于信息與知識(shí)之間的差異。
4)雖然知識(shí)構(gòu)建與信息構(gòu)建在某些方面的表現(xiàn)形式相似,知識(shí)構(gòu)建以信息構(gòu)建為基礎(chǔ),但知識(shí)構(gòu)建不是簡(jiǎn)單地由信息構(gòu)建過渡而來,也就是說,好的信息構(gòu)建基礎(chǔ)不一定就能產(chǎn)生好的知識(shí)構(gòu)建,知識(shí)構(gòu)建是在信息構(gòu)建與其他背景因素綜合的基礎(chǔ)上形成的一個(gè)更復(fù)雜的體系結(jié)構(gòu)。
5)信息構(gòu)建的焦點(diǎn)在于如何建立人與信息之間的有效關(guān)聯(lián),它一般是面向某個(gè)具體應(yīng)用的,如網(wǎng)站的用戶;而知識(shí)構(gòu)建的焦點(diǎn)在于如何建立人與人之間有效的知識(shí)關(guān)聯(lián),它與某個(gè)具體應(yīng)用無關(guān),是通用的、面向基礎(chǔ)的,相對(duì)而言是多維的、動(dòng)態(tài)的,如企業(yè)知識(shí)工程。、時(shí)間和地點(diǎn)的線索。它能夠反映人們需要獲取的知識(shí)的類別,能夠直觀地提供組織中知識(shí)的視覺展示,揭示組織業(yè)務(wù)環(huán)境中知識(shí)的分布和流動(dòng)情況。知識(shí)地圖除了關(guān)注內(nèi)容以外,還需要關(guān)注任務(wù)、人員和社團(tuán)幾個(gè)維度,不僅對(duì)信息行為建模,還要為它的人員、政策、技術(shù)和智能結(jié)構(gòu)建模。
5.信息構(gòu)建向知識(shí)構(gòu)建發(fā)展的條件
知識(shí)建筑師是設(shè)計(jì)一些空間供人們?cè)谄渲羞M(jìn)行交互活動(dòng)并產(chǎn)生交互影響的人們,他們?cè)O(shè)計(jì)動(dòng)態(tài)的交互影響使人們生成概念的因素,反映出他們互相交互過程中的屬性,顯然信息建筑師(Information Architect)的工作與他們的工作還是有相當(dāng)大的差距的。我們還沒有研究出滿足從信息構(gòu)建向知識(shí)構(gòu)建發(fā)展的充分條件,但是,要實(shí)現(xiàn)從信息構(gòu)建到知識(shí)構(gòu)建的發(fā)展,起碼要滿足以下條件:
- 建立一種系統(tǒng)架構(gòu),提供一種智能交互的環(huán)境。正如T.Reamy所言:知識(shí)不是我們典型意義上存儲(chǔ)下來的東西,相反,我們存儲(chǔ)信息,是讓人們將它轉(zhuǎn)化為知識(shí)。這意味著知識(shí)構(gòu)建不僅關(guān)注存儲(chǔ)系統(tǒng)的結(jié)構(gòu),還要關(guān)注其中嵌入的,讓人們?cè)?a href="/wiki/%E4%BF%A1%E6%81%AF%E7%B3%BB%E7%BB%9F" title="信息系統(tǒng)">信息系統(tǒng)中相互影響的,將信息轉(zhuǎn)化為知識(shí)的知識(shí)管理過程,并且要讓這個(gè)過程更容易、更快捷和更有生產(chǎn)力。
- 為不同的知識(shí)狀態(tài)建模,讓知識(shí)能夠獲得。Visioncor公司提出建立“集成化的知識(shí)構(gòu)建”方法來增加內(nèi)容的價(jià)值和可用性,這種方法按照內(nèi)容被使用的情況來對(duì)它們進(jìn)行分類。不管內(nèi)容是信息、要學(xué)習(xí)的知識(shí)還是共享知識(shí),這種集成化的知識(shí)構(gòu)建方法都可以作為一種指南,將所組織的內(nèi)容組織成為一些小型的可以再利用的小塊并在它們之間建立有意義的、直觀的聯(lián)系,結(jié)果是用戶在需要時(shí)能夠快速定位所有的相關(guān)知識(shí)。
- 建立能夠捕捉個(gè)人頭腦中的隱性知識(shí)的特征概貌圖,建立人與人之間的知識(shí)聯(lián)系。挖掘個(gè)人頭腦中的隱性知識(shí)是知識(shí)管理的重要任務(wù),這個(gè)任務(wù)與知識(shí)構(gòu)建的目標(biāo)是一致的。知識(shí)構(gòu)建不僅要為顯性知識(shí),還需要為隱性知識(shí)建立可能的關(guān)聯(lián);不僅建立人與信息之間的聯(lián)系,還要建立人與人之間的聯(lián)系。
- 建立知識(shí)地圖,支持合作研究。信息構(gòu)建的一個(gè)重要產(chǎn)品是內(nèi)容地圖(Content Map),而知識(shí)構(gòu)建要在內(nèi)容地圖的基礎(chǔ)上生成一個(gè)更豐富、更復(fù)雜、更多維、更人性化的知識(shí)地圖。內(nèi)容地圖是內(nèi)容規(guī)劃映射(Information Mapping)的結(jié)果,它常常被信息建筑師用來對(duì)付信息過載和將非結(jié)構(gòu)化的信息轉(zhuǎn)化為可管理的和可被再使用的文獻(xiàn),以便它們今后能為不同的使用目標(biāo)而被多次使用。知識(shí)地圖是表示知識(shí)概念及其聯(lián)合關(guān)系的網(wǎng)絡(luò)結(jié)構(gòu),是知識(shí)資源的導(dǎo)航系統(tǒng)。它不僅提供組織運(yùn)作所需要的知識(shí)要素,還提供有關(guān)人、時(shí)間和地點(diǎn)的線索。它能夠反映人們需要獲取的知識(shí)的類別,能夠直觀地提供組織中知識(shí)的視覺展示,揭示組織業(yè)務(wù)環(huán)境中知識(shí)的分布和流動(dòng)情況。知識(shí)地圖除了關(guān)注內(nèi)容以外,還需要關(guān)注任務(wù)、人員和社團(tuán)幾個(gè)維度,不僅對(duì)信息行為建模,還要為它的人員、政策、技術(shù)和智能結(jié)構(gòu)建模。