登錄

企業(yè)知識(shí)倉(cāng)庫(kù)

百科 > 知識(shí)管理術(shù)語(yǔ) > 企業(yè)知識(shí)倉(cāng)庫(kù)

1.什么是知識(shí)倉(cāng)庫(kù)

知識(shí)倉(cāng)庫(kù)起初來(lái)源于數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse),在過(guò)去的十幾年里,現(xiàn)代電子技術(shù)的日益發(fā)展,使基于計(jì)算機(jī)技術(shù)的數(shù)據(jù)庫(kù)技術(shù)得以長(zhǎng)足發(fā)展。近年來(lái),人們對(duì)數(shù)據(jù)庫(kù)的研究方向由原來(lái)單一的日常事務(wù)電子化發(fā)展成對(duì)數(shù)據(jù)的陣系結(jié)構(gòu),數(shù)據(jù)的含義進(jìn)行研究。公認(rèn)的數(shù)據(jù)庫(kù)之父H.W.Inmon給數(shù)據(jù)倉(cāng)庫(kù)下的定義是:數(shù)據(jù)倉(cāng)庫(kù)是集成的、面向主題的,用于決策支持的數(shù)據(jù)庫(kù)集合。

知識(shí)倉(cāng)庫(kù)是以多行業(yè)、多類(lèi)別數(shù)據(jù)倉(cāng)庫(kù)組成的一個(gè)集合,它涉及眾多行業(yè)、眾多層次的單位,在形式上包括文字、影像、圖形等以多媒體形式具體存在的表現(xiàn)形式,也應(yīng)包括以某種理論、假想算法,推論存在的抽象的東西。其組成一個(gè)比較龐大的知識(shí)的綜合體,大可以指導(dǎo)一個(gè)國(guó)家,乃至一個(gè)世界發(fā)展的方向,小至指導(dǎo)一個(gè)企業(yè)的發(fā)展策略,甚至個(gè)人的發(fā)展前途。

2.企業(yè)知識(shí)倉(cāng)庫(kù)的組成

知識(shí)倉(cāng)庫(kù)在具體的組成形式上應(yīng)包括以下幾部分:

(1)完善而性能可靠的硬件體系:主要依靠現(xiàn)代電子技術(shù),尤其是計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù),二者構(gòu)成知識(shí)倉(cāng)庫(kù)最基本的部件。

(2)功能強(qiáng)大的軟件體系:傾向于專(zhuān)業(yè)的、分行業(yè)的將知識(shí)進(jìn)行收集、整理統(tǒng)計(jì)、數(shù)據(jù)分析等工作的專(zhuān)業(yè)系統(tǒng)。

(3)主體為高素質(zhì)的專(zhuān)業(yè)技術(shù)人員:完成與知識(shí)倉(cāng)庫(kù)的遠(yuǎn)程控制,使之有效的工作。

(4)廣泛的社會(huì)實(shí)踐者:將廣泛存在的知識(shí)以專(zhuān)門(mén)的形式整理、聚集,以不斷充實(shí)知識(shí)倉(cāng)庫(kù)的素材來(lái)源,具體則表現(xiàn)以行業(yè)的不同而身份不同。

3.企業(yè)知識(shí)倉(cāng)庫(kù)的特點(diǎn)

知識(shí)倉(cāng)庫(kù)利用其廣泛的數(shù)據(jù)知識(shí)資源,經(jīng)過(guò)嚴(yán)密、科學(xué)的分析整理,根據(jù)條件的不同,可利用于各行各業(yè),指導(dǎo)各行各業(yè)的單位實(shí)體或個(gè)人能夠沿正確的發(fā)展方向發(fā)展,能夠?qū)⒆钕冗M(jìn)的理論、最新的技術(shù)運(yùn)用到最實(shí)際的生產(chǎn)生活中去??偟膩?lái)說(shuō),知識(shí)倉(cāng)庫(kù)的應(yīng)用有以下幾個(gè)方面的特點(diǎn):

(1)適用的行業(yè)多:知識(shí)倉(cāng)庫(kù)來(lái)源于各行各業(yè)的最基層工作者經(jīng)驗(yàn)技術(shù)的總結(jié)加工,根據(jù)知識(shí)倉(cāng)庫(kù)的分類(lèi)匯總分析統(tǒng)計(jì),形成的面向?qū)I(yè)的知識(shí)決策支持系統(tǒng),可完成相對(duì)應(yīng)專(zhuān)業(yè)的知識(shí)支持功能。

(2)強(qiáng)大的知識(shí)支持輔助決策功能:知識(shí)倉(cāng)庫(kù)利用其海量的數(shù)據(jù)、智能并行的知識(shí)處理能力,輔之計(jì)算機(jī)人工智能的發(fā)展,可以完成對(duì)面向?qū)I(yè)知識(shí)的支持,解決企事業(yè)單位在具體操作工作中面臨的知識(shí)缺乏的問(wèn)題,提供理論知識(shí)、技術(shù)知識(shí),輔以專(zhuān)家系統(tǒng)的知識(shí)倉(cāng)庫(kù)更能在事件的決策中起到輔助決策的作用。

4.知識(shí)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)和知識(shí)倉(cāng)庫(kù)

知識(shí)庫(kù)是存放知識(shí)的集合,一般專(zhuān)用于智能系統(tǒng)中存放相關(guān)領(lǐng)域知識(shí),在規(guī)模上比較小,知識(shí)的種類(lèi)也比較單一。

數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、非易失的且隨時(shí)間變化的數(shù)據(jù)集合,用來(lái)支持管理人員的決策。最主要的特點(diǎn)是數(shù)據(jù)種類(lèi)多和數(shù)量大,按照主題組織數(shù)據(jù),支持決策。

知識(shí)管理面向的知識(shí)來(lái)源多、種類(lèi)多、數(shù)量大,不僅包含大量的數(shù)據(jù),更重要的是大量數(shù)據(jù)之后隱藏的知識(shí)。另外,知識(shí)管理涉及的人員復(fù)雜,不像是數(shù)據(jù)倉(cāng)庫(kù)主要是滿(mǎn)足決策者的需要,知識(shí)管理系統(tǒng)需要滿(mǎn)足不同人員的需要。知識(shí)管理中用來(lái)存儲(chǔ)知識(shí)和數(shù)據(jù)的存儲(chǔ)體與數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)不同,但又相似的內(nèi)容,所以提出知識(shí)倉(cāng)庫(kù)的概念,實(shí)際上是兩者的有機(jī)結(jié)合。

因此,知識(shí)倉(cāng)庫(kù)是面向主題的、對(duì)多種類(lèi)型知識(shí)庫(kù)進(jìn)行集成、滿(mǎn)足多種類(lèi)型用戶(hù)的需要的數(shù)據(jù)和操作集合。數(shù)據(jù)倉(cāng)庫(kù)應(yīng)該具有很好的適應(yīng)性、靈活性、可擴(kuò)充性、健壯性、易用性、安全性。知識(shí)倉(cāng)庫(kù)的整體結(jié)構(gòu)可以參照數(shù)據(jù)倉(cāng)庫(kù),可以利用數(shù)據(jù)倉(cāng)庫(kù)的一些思想來(lái)組織數(shù)據(jù)。

5.企業(yè)知識(shí)倉(cāng)庫(kù)與知識(shí)管理系統(tǒng)

Joseph M.Firestone(1999)認(rèn)為,知識(shí)倉(cāng)庫(kù)與知識(shí)管理系統(tǒng)實(shí)際上是同一概念,因?yàn)橹R(shí)倉(cāng)庫(kù)的管理對(duì)象也是知識(shí)。但是,在組織實(shí)施知識(shí)管理這樣一個(gè)背景下,區(qū)分知識(shí)倉(cāng)庫(kù)和知識(shí)管理系統(tǒng)還是必要的。

(1)它們的目標(biāo)不同。知識(shí)管理系統(tǒng)應(yīng)該支持組織知識(shí)管理的所有環(huán)節(jié),而知識(shí)倉(cāng)庫(kù)僅關(guān)注顯性知識(shí)的存儲(chǔ)。

(2)如果把知識(shí)戰(zhàn)略、知識(shí)組織、知識(shí)文化等環(huán)境要素也看作組織知識(shí)管理系統(tǒng)的組成部分,則組織知識(shí)管理系統(tǒng)的范圍就比知識(shí)倉(cāng)庫(kù)大得多。

所以,知識(shí)倉(cāng)庫(kù)是知識(shí)管理系統(tǒng)的重要組成部分。

首先,知識(shí)存儲(chǔ)是組織知識(shí)循環(huán)過(guò)程中的關(guān)鍵環(huán)節(jié)。如果沒(méi)有對(duì)顯性知識(shí)的系統(tǒng)化、集成化的存儲(chǔ),知識(shí)的整理、傳遞、共享等都無(wú)從談起。

其次,在知識(shí)管理系統(tǒng)建設(shè)過(guò)程中,知識(shí)倉(cāng)庫(kù)建設(shè)所涉及的工作最大,范圍最廣。知識(shí)倉(cāng)庫(kù)建設(shè)不僅涉及到軟件的部署,最重要的還是對(duì)組織知識(shí)資源的調(diào)查、分析和分類(lèi)組織。這項(xiàng)工作需要一個(gè)由計(jì)算機(jī)專(zhuān)家、領(lǐng)域?qū)<液椭R(shí)管理專(zhuān)家組成的小組來(lái)完成,關(guān)系到整個(gè)系統(tǒng)建設(shè)的成敗。

可以說(shuō),知識(shí)倉(cāng)庫(kù)是組織知識(shí)管理系統(tǒng)的核心要素,是知識(shí)管理系統(tǒng)建設(shè)的硬件。

6.企業(yè)知識(shí)倉(cāng)庫(kù)的地位

知識(shí)可劃分為顯性知識(shí)(explicit knowledge)和隱性知識(shí)(tacit knowledge)兩類(lèi)。其中,顯性知識(shí)是指能夠用語(yǔ)言、符號(hào)、規(guī)則、公式或?qū)ο蟮日奖磉_(dá)并能夠傳輸給他人的知識(shí);隱性知識(shí)是深深根植于人腦中的信念、觀點(diǎn)、創(chuàng)意和智力模型,包括某人長(zhǎng)期從事某項(xiàng)活動(dòng)或職業(yè)而形成的主觀經(jīng)驗(yàn)、洞察力和直覺(jué)。二者緊密關(guān)聯(lián),并與經(jīng)濟(jì)活動(dòng)融為一體,成為當(dāng)代社會(huì)發(fā)展的主要推進(jìn)力量。

知識(shí)管理是通過(guò)共享和抓住隱性知識(shí)并將其轉(zhuǎn)變?yōu)轱@性知識(shí),篩選、存儲(chǔ)、加工、檢索、傳遞和利用顯性知識(shí),創(chuàng)新新的知識(shí)來(lái)增加社會(huì)價(jià)值的。這種實(shí)踐活動(dòng)可用知識(shí)螺旋(Knowledge Spiral)來(lái)描述。在每一個(gè)螺旋中存在4個(gè)階段:共享隱性知識(shí)階段、隱性知識(shí)轉(zhuǎn)變?yōu)轱@性知識(shí)階段、顯性知識(shí)轉(zhuǎn)變?yōu)樾轮R(shí)階段和通過(guò)學(xué)習(xí)產(chǎn)生新的隱性知識(shí)階段。每一次新的顯性知識(shí)和隱性知識(shí)的產(chǎn)生便是知識(shí)螺旋的一次上升。

相對(duì)于知識(shí)管理,信息管理注重顯性知識(shí)或稱(chēng)編碼型知識(shí)(Codified Knowledge)的搜集、存儲(chǔ)、加工、檢索、分析和預(yù)測(cè),這方面的研究成果主要表現(xiàn)為數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)和利用。數(shù)據(jù)倉(cāng)庫(kù)使企業(yè)能抽取、篩選、存儲(chǔ)大量的數(shù)據(jù),對(duì)用戶(hù)的檢索進(jìn)行有效而準(zhǔn)確的反應(yīng),并為決策活動(dòng)提供了強(qiáng)大的基礎(chǔ)。然而,數(shù)據(jù)倉(cāng)庫(kù)中僅僅存儲(chǔ)了決策者所需知識(shí)的一部分,企業(yè)絕大部分智力財(cái)富以隱性知識(shí)的方式存在于員工的大腦中,因此,數(shù)據(jù)倉(cāng)庫(kù)不足以滿(mǎn)足對(duì)知識(shí)檢索的需求。為了滿(mǎn)足知識(shí)管理和知識(shí)決策的需求,可以對(duì)現(xiàn)存的企業(yè)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)一步擴(kuò)充,成為滿(mǎn)足知識(shí)管理需求的知識(shí)倉(cāng)庫(kù)。知識(shí)倉(cāng)庫(kù)能夠?qū)Σ煌?lèi)型的知識(shí)(顯性知識(shí)和隱性知識(shí))和不同形式的知識(shí)(純文本、二進(jìn)制對(duì)象、模型等)進(jìn)行捕捉、存儲(chǔ)、編碼、組織和分析。另外,這些知識(shí)還包括元知識(shí)(關(guān)于知識(shí)的知識(shí))和分析后產(chǎn)生的新知識(shí)。

7.企業(yè)知識(shí)倉(cāng)庫(kù)的功能

基于上述對(duì)企業(yè)知識(shí)倉(cāng)庫(kù)概念的認(rèn)識(shí),我們認(rèn)為一個(gè)企業(yè)知識(shí)倉(cāng)庫(kù)應(yīng)具備如下基本功能。

(1)知識(shí)獲取功能

獲取完整正確的企業(yè)知識(shí)是實(shí)現(xiàn)企業(yè)知識(shí)存貯和共享的前提。也是知識(shí)倉(cāng)庫(kù)應(yīng)具備的重要功能之一。獲取知識(shí)的方式有人工和自動(dòng)獲取兩種形式。人工獲取往往由知識(shí)工程師與領(lǐng)域?qū)<?、用?hù)等相互協(xié)作和交流,對(duì)企業(yè)大量的知識(shí)資源進(jìn)行抽取、歸納、整理等得到,然后通過(guò)知識(shí)倉(cāng)庫(kù)的知識(shí)導(dǎo)入界面錄入知識(shí)倉(cāng)庫(kù)。人工知識(shí)獲取不能從數(shù)量巨大的信息或知識(shí)資源中獲取潛在知識(shí),也不能及時(shí)地從系統(tǒng)運(yùn)作中獲取新知識(shí)。由于知識(shí)的時(shí)效性,為保證知識(shí)倉(cāng)庫(kù)中知識(shí)的正確、完整,知識(shí)倉(cāng)庫(kù)還需具備知識(shí)的自動(dòng)獲取功能,它能與現(xiàn)有的企業(yè)知識(shí)庫(kù)、信息資源庫(kù)相連,運(yùn)用數(shù)據(jù)挖掘技術(shù)、機(jī)器學(xué)習(xí)技術(shù)、基于案例的推理及神經(jīng)網(wǎng)絡(luò)技術(shù)等自動(dòng)從大量知識(shí)資源中抽取有效知識(shí),能從專(zhuān)家知識(shí)擁有者中自動(dòng)獲取難以表述的經(jīng)驗(yàn)、動(dòng)作、意念等隱性知識(shí)。

(2)知識(shí)導(dǎo)入功能

知識(shí)倉(cāng)庫(kù)的知識(shí)不僅需要知識(shí)工程師錄入,而且允許各類(lèi)普通用戶(hù)或其他系統(tǒng)以各種輸入手段將其知識(shí)信息及時(shí)導(dǎo)入,知識(shí)倉(cāng)庫(kù)應(yīng)具備知識(shí)導(dǎo)入功能,該功能能為各種類(lèi)型的知識(shí)制定不同的知識(shí)交流界面,使用戶(hù)能按特定的知識(shí)描述格式輸入知識(shí),同時(shí)對(duì)現(xiàn)有信息系統(tǒng)或外界系統(tǒng)導(dǎo)入的信息可借助于智能代理技術(shù)實(shí)現(xiàn)對(duì)知識(shí)的自動(dòng)抽取或加載。

(3)知識(shí)的分類(lèi)

存貯和檢索功能。企業(yè)知識(shí)種類(lèi)繁多,需要存儲(chǔ)的不只是知識(shí)條目,還需包括與之相關(guān)的事件、使用情況、來(lái)源線(xiàn)索等信息,這些信息可能以文本、聲音、圖像、表格、超文本等多種格式體現(xiàn)。知識(shí)倉(cāng)庫(kù)應(yīng)能根據(jù)不同的知識(shí)特征進(jìn)行分類(lèi),采用多種類(lèi)型的數(shù)據(jù)庫(kù)進(jìn)行分布式存儲(chǔ),能對(duì)各種結(jié)構(gòu)的知識(shí)進(jìn)行統(tǒng)一集成。同時(shí)對(duì)存儲(chǔ)的知識(shí)應(yīng)能方便地進(jìn)行查詢(xún)和檢索。為此,知識(shí)倉(cāng)庫(kù)還應(yīng)提供強(qiáng)大的知識(shí)檢索功能,能以各種手段為知識(shí)工程師或普通用戶(hù)提供便捷的知識(shí)查詢(xún),同時(shí)能在查詢(xún)中起到導(dǎo)航作用。

(4)知識(shí)維護(hù)功能

由于知識(shí)的時(shí)效性,知識(shí)倉(cāng)庫(kù)中的知識(shí)是動(dòng)態(tài)變化的,知識(shí)倉(cāng)庫(kù)應(yīng)在保證其中知識(shí)質(zhì)量的同時(shí),監(jiān)督知識(shí)的使用情況,監(jiān)督來(lái)自各種知識(shí)源的知識(shí),不斷調(diào)整知識(shí)結(jié)構(gòu),及時(shí)刪除不正確、不完整的知識(shí),對(duì)過(guò)時(shí)的知識(shí)進(jìn)行更新。另外,由于企業(yè)知識(shí)對(duì)不同級(jí)別的人往往有不同的訪問(wèn)權(quán),知識(shí)倉(cāng)庫(kù)的維護(hù)中應(yīng)設(shè)立多級(jí)安全認(rèn)證,對(duì)不同級(jí)別的維護(hù)者賦予不同的知識(shí)存取權(quán)限,以此來(lái)保證知識(shí)的正確性和完整性。

(5)知識(shí)推送功能

為給用戶(hù)提供便捷的知識(shí)共享界面,使用戶(hù)所需知識(shí)能在恰當(dāng)?shù)臅r(shí)候及時(shí)展現(xiàn)在合適的用戶(hù)面前,知識(shí)倉(cāng)庫(kù)應(yīng)能按預(yù)定的知識(shí)描述格式提取關(guān)鍵字并與知識(shí)倉(cāng)庫(kù)中相應(yīng)問(wèn)題的解決方案進(jìn)行匹配,將用戶(hù)感興趣的知識(shí)自動(dòng)、及時(shí)的推送到用戶(hù)界面。

8.企業(yè)知識(shí)倉(cāng)庫(kù)的設(shè)計(jì)

1.知識(shí)倉(cāng)庫(kù)的體系結(jié)構(gòu)設(shè)計(jì)

知識(shí)倉(cāng)庫(kù)的體系結(jié)構(gòu)不存在統(tǒng)一的模式,它的內(nèi)容應(yīng)該是活潑的,依組織的具體情況而定。然而這不是說(shuō)知識(shí)倉(cāng)庫(kù)的體系結(jié)構(gòu)沒(méi)有模式可循,實(shí)際上,存在著多個(gè)合理的模式可供選擇。

這里提出一個(gè)基于智力動(dòng)產(chǎn)價(jià)值提升理論(圖1)的新的知識(shí)倉(cāng)庫(kù)體系結(jié)構(gòu)模型(圖2),此模型分為三層。

Image:智力動(dòng)產(chǎn)價(jià)值提升.jpg Image:知識(shí)倉(cāng)庫(kù)體系結(jié)構(gòu)模型.jpg

(1)知識(shí)庫(kù)和知識(shí)裝入代理組成的數(shù)據(jù)、信息層。

(2)知識(shí)引擎組成的知識(shí)層。

(3)分析工具、檢索工具等組成的激活層。

描述知識(shí)及其關(guān)聯(lián)背景的元數(shù)據(jù)作為共享資源貫穿各層。組織的數(shù)據(jù)、信息經(jīng)過(guò)這三層的加工、處理,以活化的知識(shí)(即情報(bào))的形式呈現(xiàn)給用戶(hù),支持用戶(hù)的學(xué)習(xí)和決策。

數(shù)據(jù)、信息層負(fù)責(zé)知識(shí)的捕獲、組織與存儲(chǔ),包括知識(shí)庫(kù)和知識(shí)裝入代理。知識(shí)庫(kù)可分為方法庫(kù)、模型庫(kù)、數(shù)據(jù)庫(kù)、文檔庫(kù)等,并可根據(jù)組織的知識(shí)構(gòu)成情況加以增減。知識(shí)裝入代理可以是知識(shí)工人與智能代理程序組成的人機(jī)系統(tǒng),它主動(dòng)地掃描、分析組織的知識(shí)資源,發(fā)現(xiàn)知識(shí)單元及其相互之間的聯(lián)系,對(duì)知識(shí)單元進(jìn)行分類(lèi)組織,裝入知識(shí)庫(kù),同時(shí)把知識(shí)單元之間的聯(lián)系裝入元數(shù)據(jù)。知識(shí)裝入代理也負(fù)責(zé)對(duì)知識(shí)庫(kù)的維護(hù),發(fā)現(xiàn)并剔除過(guò)時(shí)的知識(shí)。

知識(shí)層負(fù)責(zé)知識(shí)單元的動(dòng)態(tài)連接,即把知識(shí)與其背景一同呈現(xiàn)出來(lái)。知識(shí)層的主要部件是知識(shí)引擎,是一個(gè)利用了人工智能技術(shù)的計(jì)算機(jī)程序。它接受來(lái)自激活層的訪問(wèn)請(qǐng)求,然后分析元數(shù)據(jù)中對(duì)于相關(guān)知識(shí)單元之間聯(lián)系的描述,將知識(shí)庫(kù)中的相關(guān)知識(shí)單元?jiǎng)討B(tài)地連接起來(lái),提交給激活層。它主要采用神經(jīng)網(wǎng)絡(luò)算法,將激活層的檢索請(qǐng)求與知識(shí)單元進(jìn)行匹配,然后存儲(chǔ)匹配過(guò)程,并根據(jù)用戶(hù)的確認(rèn)調(diào)整神經(jīng)網(wǎng)絡(luò)的內(nèi)部權(quán)值。

激活層負(fù)責(zé)知識(shí)的表現(xiàn),也可以叫做用戶(hù)接口層。它包括分析平臺(tái)、檢索平臺(tái)、重組平臺(tái)、推送平臺(tái)等,可根據(jù)實(shí)際需要加以增減。分析平臺(tái)面向決策人員,需要采用多種人工智能技術(shù),包括神經(jīng)網(wǎng)絡(luò)、遺傳算法、基于事例的推理等。由于各種算法應(yīng)用的范圍不同,因此,平臺(tái)還需要具有根據(jù)環(huán)境調(diào)度各種算法的能力。檢索平臺(tái)面向組織的知識(shí)參考需求,可采用自然語(yǔ)言檢索的方式,減輕用戶(hù)的智力負(fù)擔(dān)。重組平臺(tái)主要面向組織的個(gè)性化學(xué)習(xí)需求,它可以根據(jù)學(xué)習(xí)主體的情況,將相關(guān)知識(shí)重新組合,生成個(gè)性化的教材。推送平臺(tái)使用戶(hù)可以訂閱感興趣的信息或知識(shí),通過(guò)各種終端(PC,PDA等)隨時(shí)隨地接收信息。

元數(shù)據(jù)是此模型中非常重要的一個(gè)部分。作為各層的共享資源,它記錄了知識(shí)庫(kù)中裝入數(shù)據(jù)的來(lái)源、描述以及知識(shí)單元之間的關(guān)聯(lián)。

2.知識(shí)倉(cāng)庫(kù)的主題劃分

由于知識(shí)倉(cāng)庫(kù)是面向主題的,因此知識(shí)倉(cāng)庫(kù)設(shè)計(jì)的第一項(xiàng)要完成的任務(wù)就是對(duì)系統(tǒng)主題進(jìn)行劃分。知識(shí)倉(cāng)庫(kù)的分析主題應(yīng)該涵蓋企業(yè)方方面面的知識(shí),而且,不同企業(yè)需求不同,對(duì)知識(shí)倉(cāng)庫(kù)主題的劃分的角度也有所不同,在這里,本文僅從支撐經(jīng)營(yíng)運(yùn)作的角度對(duì)知識(shí)進(jìn)行劃分(如圖3)。

Image:知識(shí)劃分圖.jpg

3.知識(shí)倉(cāng)庫(kù)的概念模型設(shè)計(jì)

概念模型是一種面向問(wèn)題的數(shù)據(jù)模型,它描述了從用戶(hù)角度看到的知識(shí)倉(cāng)庫(kù)的內(nèi)容及其聯(lián)系,是一種純粹的現(xiàn)實(shí)反應(yīng),而與存貯結(jié)構(gòu)、存取方式等知識(shí)倉(cāng)庫(kù)的具體實(shí)現(xiàn)內(nèi)容無(wú)關(guān)。概念模型是聯(lián)系主觀與客觀的橋梁,它是一個(gè)為一定的目標(biāo)設(shè)計(jì)系統(tǒng)、收集信息而服務(wù)的概念型工具。具體到計(jì)算機(jī)系統(tǒng)中,概念模型是客觀世界到計(jì)算機(jī)世界的一個(gè)中間層次。

知識(shí)概念模型的設(shè)計(jì)需要給出一個(gè)知識(shí)倉(cāng)庫(kù)的粗略藍(lán)本,以此為工具來(lái)判定設(shè)計(jì)者是否已經(jīng)正確地了解知識(shí)倉(cāng)庫(kù)最終用戶(hù)的信息需求。在概念模型設(shè)計(jì)階段,主要完成星型模型和雪花模型的設(shè)計(jì)。

4.知識(shí)倉(cāng)庫(kù)的邏輯模型設(shè)計(jì)

邏輯模型亦可稱(chēng)為中間層數(shù)據(jù)模型,它是對(duì)高層的細(xì)分。盡管應(yīng)用星型模型和雪花模型可以在概念模型設(shè)計(jì)中建立數(shù)據(jù)倉(cāng)庫(kù)的概念模型,但是無(wú)法直接依靠概念模型實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)的物理模型,還要依靠邏輯模型作為概念模型到物理模型轉(zhuǎn)換的橋梁。

知識(shí)倉(cāng)庫(kù)一般都建立在關(guān)系數(shù)據(jù)基礎(chǔ)上,因此,數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)過(guò)程中所采用的邏輯模型主要是關(guān)系模型。但是,不同的機(jī)器系統(tǒng)又有許多不同的限制,提供不同的環(huán)境與工具。所以,在進(jìn)行邏輯模型設(shè)計(jì)時(shí)一般要分三步進(jìn)行。

(1)將概念模型轉(zhuǎn)化為一般的關(guān)系模型。一般情況下,我們都是由E-R圖轉(zhuǎn)換導(dǎo)出關(guān)系數(shù)據(jù)模型。由于關(guān)系模型的邏輯結(jié)構(gòu)是一組關(guān)系模式的集合,而E-R圖則是由實(shí)體、實(shí)體的屬性和實(shí)體之間的聯(lián)系三個(gè)要素組成的,所以將E-R圖轉(zhuǎn)化為關(guān)系模型實(shí)際就是要將實(shí)體、實(shí)體的屬性和實(shí)體之間的聯(lián)系轉(zhuǎn)化為關(guān)系模式。

(2)將轉(zhuǎn)化的關(guān)系模型向特定的數(shù)據(jù)倉(cāng)庫(kù)支持下的數(shù)據(jù)模型轉(zhuǎn)換。這一步轉(zhuǎn)化是依賴(lài)于機(jī)器的,沒(méi)有普遍的規(guī)則,轉(zhuǎn)換的主要依據(jù)是知識(shí)倉(cāng)庫(kù)的功能及限制。

(3)對(duì)數(shù)據(jù)模型進(jìn)行優(yōu)化。由于知識(shí)倉(cāng)庫(kù)的邏輯設(shè)計(jì)的結(jié)果不是唯一的。為了進(jìn)一步提高知識(shí)倉(cāng)庫(kù)的系統(tǒng)性能,還應(yīng)當(dāng)適當(dāng)?shù)男薷?、調(diào)整數(shù)據(jù)模型的結(jié)構(gòu),主要為:確定數(shù)據(jù)依賴(lài),并對(duì)數(shù)據(jù)依賴(lài)進(jìn)行最小化處理、消除冗余關(guān)系等等。

9.知識(shí)倉(cāng)庫(kù)管理技術(shù)

(1)、決策支持

決策支持工具是將知識(shí)倉(cāng)庫(kù)與現(xiàn)實(shí)應(yīng)用相互關(guān)系的工具,知識(shí)倉(cāng)庫(kù)利用已有的知識(shí),按照相應(yīng)的條件約束,對(duì)某一問(wèn)題可以作以輔導(dǎo)決策,這其中應(yīng)用到人工智能技術(shù)、專(zhuān)家系統(tǒng)技術(shù)、軟件工程技術(shù),也是知識(shí)倉(cāng)庫(kù)今后發(fā)展的主要利用方向[2]。其包括知識(shí)查詢(xún)工具、知識(shí)解釋工具、多維分析工具和知識(shí)控屬工具。知識(shí)查詢(xún)指以某種檢索條件為依據(jù)而提出的一般知識(shí)請(qǐng)求,知識(shí)解釋則是對(duì)知識(shí)處理和可視化知識(shí)的展現(xiàn)(如統(tǒng)計(jì)分析等)。

知識(shí)多維分析是指從業(yè)務(wù)角度對(duì)數(shù)據(jù)聚集的分析,又稱(chēng)隨機(jī)分析處理(OLAP)。由于軟件技術(shù)和工具軟件的不斷改進(jìn),多維聯(lián)機(jī)可以更準(zhǔn)確、更直接、更直觀的將知識(shí)所蘊(yùn)含的內(nèi)涵作用顯現(xiàn)出來(lái)。

(2)、知識(shí)發(fā)現(xiàn)

知識(shí)發(fā)現(xiàn)通常稱(chēng)為數(shù)據(jù)挖掘,也叫信息發(fā)現(xiàn),在一般的業(yè)務(wù)分析中,最終用戶(hù)頭腦中已經(jīng)有了具體的問(wèn)題,例如:"8月份某產(chǎn)品銷(xiāo)售了多少?"這一問(wèn)題借助決策支持工具可以方便的從知識(shí)倉(cāng)庫(kù)查到相應(yīng)的信息以及歷史情況曲線(xiàn)分析、可能存在或面臨的問(wèn)題,目前的數(shù)據(jù)挖掘工具主要有數(shù)據(jù)關(guān)聯(lián)、順序狹義、分類(lèi)器和聚類(lèi)技術(shù)。知識(shí)發(fā)現(xiàn)的方法和實(shí)施過(guò)程:從技術(shù)上講,發(fā)掘的實(shí)施大體可以分為五個(gè)步驟:

  • 選擇和準(zhǔn)備發(fā)掘的數(shù)據(jù);
  • 預(yù)處理;
  • 研究開(kāi)發(fā)一種或多種數(shù)據(jù)知識(shí)挖掘工具;
  • 發(fā)現(xiàn)未知知識(shí);
  • 運(yùn)用已發(fā)現(xiàn)的知識(shí)于決策支持,達(dá)到特定目標(biāo)。

(3)、WWW與知識(shí)倉(cāng)庫(kù)的融合

WWW技術(shù)的飛速發(fā)展,對(duì)知識(shí)倉(cāng)庫(kù)的發(fā)展產(chǎn)生很大影響。首先是基于Web的決策支持工具的出現(xiàn),改變了用戶(hù)對(duì)知識(shí)倉(cāng)庫(kù)的使用方式,不同局限于某一范圍獲得的知識(shí),而是通過(guò)Internet/Intranet遠(yuǎn)程訪問(wèn)知識(shí)倉(cāng)庫(kù)。其次用于訪問(wèn)知識(shí)倉(cāng)庫(kù)的信息目錄也可以通過(guò)Web瀏覽器來(lái)查詢(xún)和發(fā)布知識(shí),這種方式極大程度上使知識(shí)倉(cāng)庫(kù)技術(shù)通過(guò)WWW更能擴(kuò)大其應(yīng)用范圍。

10.知識(shí)倉(cāng)庫(kù)的標(biāo)準(zhǔn)化與安全性

通常說(shuō)來(lái),知識(shí)倉(cāng)庫(kù)的標(biāo)準(zhǔn)化分為兩個(gè)方面:知識(shí)倉(cāng)庫(kù)的標(biāo)準(zhǔn)化和軟件系統(tǒng)的標(biāo)準(zhǔn)化。知識(shí)倉(cāng)庫(kù)是以數(shù)字化資源為基本素材,數(shù)字化資源的本身已經(jīng)相對(duì)標(biāo)準(zhǔn)化,決定了其標(biāo)準(zhǔn)化的方向。 作為知識(shí)倉(cāng)庫(kù)中的主要部分軟件系統(tǒng),其標(biāo)準(zhǔn)化的程度在某種意義上更是重要,它負(fù)責(zé)知識(shí)倉(cāng)庫(kù)與信息系統(tǒng)的知識(shí)接口問(wèn)題,在建立的過(guò)程中,力求達(dá)到知識(shí)的通用接口,使知識(shí)倉(cāng)庫(kù)的資源采集、加工、處理、輸出等接口都達(dá)到與信息系統(tǒng)的通用與兼容。

知識(shí)是構(gòu)筑一切的基礎(chǔ),并非是無(wú)國(guó)界的,或者是公開(kāi)的技術(shù),對(duì)于我們的知識(shí)倉(cāng)庫(kù),存在一些非常嚴(yán)重的課題,就是安全性?,F(xiàn)今的知識(shí)倉(cāng)庫(kù),CNKI都會(huì)受到外界的干擾、人為的惡意入侵與破壞:

  • 計(jì)算機(jī)病毒;
  • 芯片掏鬼活動(dòng);
  • 高能非核電磁脈沖;
  • 微米納米機(jī)器人和芯片細(xì)菌;
  • 黑客。

對(duì)于知識(shí)倉(cāng)庫(kù)技術(shù)安全性的問(wèn)題,應(yīng)有幾點(diǎn)考慮:

(1)對(duì)于病毒,防范是權(quán)宜之計(jì),關(guān)鍵立足長(zhǎng)遠(yuǎn),加強(qiáng)研究,積極迎接病毒對(duì)信息化社會(huì)的嚴(yán)重威脅和挑戰(zhàn)。

(2)統(tǒng)籌計(jì)劃,研究對(duì)抗技術(shù)。

(3)開(kāi)展計(jì)算機(jī)病毒的專(zhuān)題研究

總之,知識(shí)倉(cāng)庫(kù)的發(fā)展將是信息化社會(huì)的知識(shí)發(fā)展的趨勢(shì),向著智能化、網(wǎng)絡(luò)化發(fā)展,是未來(lái)智能信息系統(tǒng)的支撐環(huán)境。

評(píng)論  |   0條評(píng)論