企業(yè)知識(shí)倉庫
目錄
1.什么是知識(shí)倉庫
知識(shí)倉庫起初來源于數(shù)據(jù)倉庫(Data Warehouse),在過去的十幾年里,現(xiàn)代電子技術(shù)的日益發(fā)展,使基于計(jì)算機(jī)技術(shù)的數(shù)據(jù)庫技術(shù)得以長(zhǎng)足發(fā)展。近年來,人們對(duì)數(shù)據(jù)庫的研究方向由原來單一的日常事務(wù)電子化發(fā)展成對(duì)數(shù)據(jù)的陣系結(jié)構(gòu),數(shù)據(jù)的含義進(jìn)行研究。公認(rèn)的數(shù)據(jù)庫之父H.W.Inmon給數(shù)據(jù)倉庫下的定義是:數(shù)據(jù)倉庫是集成的、面向主題的,用于決策支持的數(shù)據(jù)庫集合。
知識(shí)倉庫是以多行業(yè)、多類別數(shù)據(jù)倉庫組成的一個(gè)集合,它涉及眾多行業(yè)、眾多層次的單位,在形式上包括文字、影像、圖形等以多媒體形式具體存在的表現(xiàn)形式,也應(yīng)包括以某種理論、假想算法,推論存在的抽象的東西。其組成一個(gè)比較龐大的知識(shí)的綜合體,大可以指導(dǎo)一個(gè)國(guó)家,乃至一個(gè)世界發(fā)展的方向,小至指導(dǎo)一個(gè)企業(yè)的發(fā)展策略,甚至個(gè)人的發(fā)展前途。
2.企業(yè)知識(shí)倉庫的組成
知識(shí)倉庫在具體的組成形式上應(yīng)包括以下幾部分:
(1)完善而性能可靠的硬件體系:主要依靠現(xiàn)代電子技術(shù),尤其是計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù),二者構(gòu)成知識(shí)倉庫最基本的部件。
(2)功能強(qiáng)大的軟件體系:傾向于專業(yè)的、分行業(yè)的將知識(shí)進(jìn)行收集、整理統(tǒng)計(jì)、數(shù)據(jù)分析等工作的專業(yè)系統(tǒng)。
(3)主體為高素質(zhì)的專業(yè)技術(shù)人員:完成與知識(shí)倉庫的遠(yuǎn)程控制,使之有效的工作。
(4)廣泛的社會(huì)實(shí)踐者:將廣泛存在的知識(shí)以專門的形式整理、聚集,以不斷充實(shí)知識(shí)倉庫的素材來源,具體則表現(xiàn)以行業(yè)的不同而身份不同。
3.企業(yè)知識(shí)倉庫的特點(diǎn)
知識(shí)倉庫利用其廣泛的數(shù)據(jù)知識(shí)資源,經(jīng)過嚴(yán)密、科學(xué)的分析整理,根據(jù)條件的不同,可利用于各行各業(yè),指導(dǎo)各行各業(yè)的單位實(shí)體或個(gè)人能夠沿正確的發(fā)展方向發(fā)展,能夠?qū)⒆钕冗M(jìn)的理論、最新的技術(shù)運(yùn)用到最實(shí)際的生產(chǎn)生活中去??偟膩碚f,知識(shí)倉庫的應(yīng)用有以下幾個(gè)方面的特點(diǎn):
(1)適用的行業(yè)多:知識(shí)倉庫來源于各行各業(yè)的最基層工作者經(jīng)驗(yàn)技術(shù)的總結(jié)加工,根據(jù)知識(shí)倉庫的分類匯總分析統(tǒng)計(jì),形成的面向?qū)I(yè)的知識(shí)決策支持系統(tǒng),可完成相對(duì)應(yīng)專業(yè)的知識(shí)支持功能。
(2)強(qiáng)大的知識(shí)支持輔助決策功能:知識(shí)倉庫利用其海量的數(shù)據(jù)、智能并行的知識(shí)處理能力,輔之計(jì)算機(jī)人工智能的發(fā)展,可以完成對(duì)面向?qū)I(yè)知識(shí)的支持,解決企事業(yè)單位在具體操作工作中面臨的知識(shí)缺乏的問題,提供理論知識(shí)、技術(shù)知識(shí),輔以專家系統(tǒng)的知識(shí)倉庫更能在事件的決策中起到輔助決策的作用。
4.知識(shí)庫、數(shù)據(jù)倉庫和知識(shí)倉庫
知識(shí)庫是存放知識(shí)的集合,一般專用于智能系統(tǒng)中存放相關(guān)領(lǐng)域知識(shí),在規(guī)模上比較小,知識(shí)的種類也比較單一。
數(shù)據(jù)倉庫是一個(gè)面向主題的、集成的、非易失的且隨時(shí)間變化的數(shù)據(jù)集合,用來支持管理人員的決策。最主要的特點(diǎn)是數(shù)據(jù)種類多和數(shù)量大,按照主題組織數(shù)據(jù),支持決策。
知識(shí)管理面向的知識(shí)來源多、種類多、數(shù)量大,不僅包含大量的數(shù)據(jù),更重要的是大量數(shù)據(jù)之后隱藏的知識(shí)。另外,知識(shí)管理涉及的人員復(fù)雜,不像是數(shù)據(jù)倉庫主要是滿足決策者的需要,知識(shí)管理系統(tǒng)需要滿足不同人員的需要。知識(shí)管理中用來存儲(chǔ)知識(shí)和數(shù)據(jù)的存儲(chǔ)體與數(shù)據(jù)庫、數(shù)據(jù)倉庫不同,但又相似的內(nèi)容,所以提出知識(shí)倉庫的概念,實(shí)際上是兩者的有機(jī)結(jié)合。
因此,知識(shí)倉庫是面向主題的、對(duì)多種類型知識(shí)庫進(jìn)行集成、滿足多種類型用戶的需要的數(shù)據(jù)和操作集合。數(shù)據(jù)倉庫應(yīng)該具有很好的適應(yīng)性、靈活性、可擴(kuò)充性、健壯性、易用性、安全性。知識(shí)倉庫的整體結(jié)構(gòu)可以參照數(shù)據(jù)倉庫,可以利用數(shù)據(jù)倉庫的一些思想來組織數(shù)據(jù)。
5.企業(yè)知識(shí)倉庫與知識(shí)管理系統(tǒng)
Joseph M.Firestone(1999)認(rèn)為,知識(shí)倉庫與知識(shí)管理系統(tǒng)實(shí)際上是同一概念,因?yàn)橹R(shí)倉庫的管理對(duì)象也是知識(shí)。但是,在組織實(shí)施知識(shí)管理這樣一個(gè)背景下,區(qū)分知識(shí)倉庫和知識(shí)管理系統(tǒng)還是必要的。
(1)它們的目標(biāo)不同。知識(shí)管理系統(tǒng)應(yīng)該支持組織知識(shí)管理的所有環(huán)節(jié),而知識(shí)倉庫僅關(guān)注顯性知識(shí)的存儲(chǔ)。
(2)如果把知識(shí)戰(zhàn)略、知識(shí)組織、知識(shí)文化等環(huán)境要素也看作組織知識(shí)管理系統(tǒng)的組成部分,則組織知識(shí)管理系統(tǒng)的范圍就比知識(shí)倉庫大得多。
所以,知識(shí)倉庫是知識(shí)管理系統(tǒng)的重要組成部分。
首先,知識(shí)存儲(chǔ)是組織知識(shí)循環(huán)過程中的關(guān)鍵環(huán)節(jié)。如果沒有對(duì)顯性知識(shí)的系統(tǒng)化、集成化的存儲(chǔ),知識(shí)的整理、傳遞、共享等都無從談起。
其次,在知識(shí)管理系統(tǒng)建設(shè)過程中,知識(shí)倉庫建設(shè)所涉及的工作最大,范圍最廣。知識(shí)倉庫建設(shè)不僅涉及到軟件的部署,最重要的還是對(duì)組織知識(shí)資源的調(diào)查、分析和分類組織。這項(xiàng)工作需要一個(gè)由計(jì)算機(jī)專家、領(lǐng)域?qū)<液椭R(shí)管理專家組成的小組來完成,關(guān)系到整個(gè)系統(tǒng)建設(shè)的成敗。
可以說,知識(shí)倉庫是組織知識(shí)管理系統(tǒng)的核心要素,是知識(shí)管理系統(tǒng)建設(shè)的硬件。
6.企業(yè)知識(shí)倉庫的地位
知識(shí)可劃分為顯性知識(shí)(explicit knowledge)和隱性知識(shí)(tacit knowledge)兩類。其中,顯性知識(shí)是指能夠用語言、符號(hào)、規(guī)則、公式或?qū)ο蟮日奖磉_(dá)并能夠傳輸給他人的知識(shí);隱性知識(shí)是深深根植于人腦中的信念、觀點(diǎn)、創(chuàng)意和智力模型,包括某人長(zhǎng)期從事某項(xiàng)活動(dòng)或職業(yè)而形成的主觀經(jīng)驗(yàn)、洞察力和直覺。二者緊密關(guān)聯(lián),并與經(jīng)濟(jì)活動(dòng)融為一體,成為當(dāng)代社會(huì)發(fā)展的主要推進(jìn)力量。
知識(shí)管理是通過共享和抓住隱性知識(shí)并將其轉(zhuǎn)變?yōu)轱@性知識(shí),篩選、存儲(chǔ)、加工、檢索、傳遞和利用顯性知識(shí),創(chuàng)新新的知識(shí)來增加社會(huì)價(jià)值的。這種實(shí)踐活動(dòng)可用知識(shí)螺旋(Knowledge Spiral)來描述。在每一個(gè)螺旋中存在4個(gè)階段:共享隱性知識(shí)階段、隱性知識(shí)轉(zhuǎn)變?yōu)轱@性知識(shí)階段、顯性知識(shí)轉(zhuǎn)變?yōu)樾轮R(shí)階段和通過學(xué)習(xí)產(chǎn)生新的隱性知識(shí)階段。每一次新的顯性知識(shí)和隱性知識(shí)的產(chǎn)生便是知識(shí)螺旋的一次上升。
相對(duì)于知識(shí)管理,信息管理注重顯性知識(shí)或稱編碼型知識(shí)(Codified Knowledge)的搜集、存儲(chǔ)、加工、檢索、分析和預(yù)測(cè),這方面的研究成果主要表現(xiàn)為數(shù)據(jù)倉庫的開發(fā)和利用。數(shù)據(jù)倉庫使企業(yè)能抽取、篩選、存儲(chǔ)大量的數(shù)據(jù),對(duì)用戶的檢索進(jìn)行有效而準(zhǔn)確的反應(yīng),并為決策活動(dòng)提供了強(qiáng)大的基礎(chǔ)。然而,數(shù)據(jù)倉庫中僅僅存儲(chǔ)了決策者所需知識(shí)的一部分,企業(yè)絕大部分智力財(cái)富以隱性知識(shí)的方式存在于員工的大腦中,因此,數(shù)據(jù)倉庫不足以滿足對(duì)知識(shí)檢索的需求。為了滿足知識(shí)管理和知識(shí)決策的需求,可以對(duì)現(xiàn)存的企業(yè)數(shù)據(jù)倉庫進(jìn)一步擴(kuò)充,成為滿足知識(shí)管理需求的知識(shí)倉庫。知識(shí)倉庫能夠?qū)Σ煌愋偷闹R(shí)(顯性知識(shí)和隱性知識(shí))和不同形式的知識(shí)(純文本、二進(jìn)制對(duì)象、模型等)進(jìn)行捕捉、存儲(chǔ)、編碼、組織和分析。另外,這些知識(shí)還包括元知識(shí)(關(guān)于知識(shí)的知識(shí))和分析后產(chǎn)生的新知識(shí)。
7.企業(yè)知識(shí)倉庫的功能
基于上述對(duì)企業(yè)知識(shí)倉庫概念的認(rèn)識(shí),我們認(rèn)為一個(gè)企業(yè)知識(shí)倉庫應(yīng)具備如下基本功能。
(1)知識(shí)獲取功能
獲取完整正確的企業(yè)知識(shí)是實(shí)現(xiàn)企業(yè)知識(shí)存貯和共享的前提。也是知識(shí)倉庫應(yīng)具備的重要功能之一。獲取知識(shí)的方式有人工和自動(dòng)獲取兩種形式。人工獲取往往由知識(shí)工程師與領(lǐng)域?qū)<摇⒂脩舻认嗷f(xié)作和交流,對(duì)企業(yè)大量的知識(shí)資源進(jìn)行抽取、歸納、整理等得到,然后通過知識(shí)倉庫的知識(shí)導(dǎo)入界面錄入知識(shí)倉庫。人工知識(shí)獲取不能從數(shù)量巨大的信息或知識(shí)資源中獲取潛在知識(shí),也不能及時(shí)地從系統(tǒng)運(yùn)作中獲取新知識(shí)。由于知識(shí)的時(shí)效性,為保證知識(shí)倉庫中知識(shí)的正確、完整,知識(shí)倉庫還需具備知識(shí)的自動(dòng)獲取功能,它能與現(xiàn)有的企業(yè)知識(shí)庫、信息資源庫相連,運(yùn)用數(shù)據(jù)挖掘技術(shù)、機(jī)器學(xué)習(xí)技術(shù)、基于案例的推理及神經(jīng)網(wǎng)絡(luò)技術(shù)等自動(dòng)從大量知識(shí)資源中抽取有效知識(shí),能從專家知識(shí)擁有者中自動(dòng)獲取難以表述的經(jīng)驗(yàn)、動(dòng)作、意念等隱性知識(shí)。
(2)知識(shí)導(dǎo)入功能
知識(shí)倉庫的知識(shí)不僅需要知識(shí)工程師錄入,而且允許各類普通用戶或其他系統(tǒng)以各種輸入手段將其知識(shí)信息及時(shí)導(dǎo)入,知識(shí)倉庫應(yīng)具備知識(shí)導(dǎo)入功能,該功能能為各種類型的知識(shí)制定不同的知識(shí)交流界面,使用戶能按特定的知識(shí)描述格式輸入知識(shí),同時(shí)對(duì)現(xiàn)有信息系統(tǒng)或外界系統(tǒng)導(dǎo)入的信息可借助于智能代理技術(shù)實(shí)現(xiàn)對(duì)知識(shí)的自動(dòng)抽取或加載。
(3)知識(shí)的分類
存貯和檢索功能。企業(yè)知識(shí)種類繁多,需要存儲(chǔ)的不只是知識(shí)條目,還需包括與之相關(guān)的事件、使用情況、來源線索等信息,這些信息可能以文本、聲音、圖像、表格、超文本等多種格式體現(xiàn)。知識(shí)倉庫應(yīng)能根據(jù)不同的知識(shí)特征進(jìn)行分類,采用多種類型的數(shù)據(jù)庫進(jìn)行分布式存儲(chǔ),能對(duì)各種結(jié)構(gòu)的知識(shí)進(jìn)行統(tǒng)一集成。同時(shí)對(duì)存儲(chǔ)的知識(shí)應(yīng)能方便地進(jìn)行查詢和檢索。為此,知識(shí)倉庫還應(yīng)提供強(qiáng)大的知識(shí)檢索功能,能以各種手段為知識(shí)工程師或普通用戶提供便捷的知識(shí)查詢,同時(shí)能在查詢中起到導(dǎo)航作用。
(4)知識(shí)維護(hù)功能
由于知識(shí)的時(shí)效性,知識(shí)倉庫中的知識(shí)是動(dòng)態(tài)變化的,知識(shí)倉庫應(yīng)在保證其中知識(shí)質(zhì)量的同時(shí),監(jiān)督知識(shí)的使用情況,監(jiān)督來自各種知識(shí)源的知識(shí),不斷調(diào)整知識(shí)結(jié)構(gòu),及時(shí)刪除不正確、不完整的知識(shí),對(duì)過時(shí)的知識(shí)進(jìn)行更新。另外,由于企業(yè)知識(shí)對(duì)不同級(jí)別的人往往有不同的訪問權(quán),知識(shí)倉庫的維護(hù)中應(yīng)設(shè)立多級(jí)安全認(rèn)證,對(duì)不同級(jí)別的維護(hù)者賦予不同的知識(shí)存取權(quán)限,以此來保證知識(shí)的正確性和完整性。
(5)知識(shí)推送功能
為給用戶提供便捷的知識(shí)共享界面,使用戶所需知識(shí)能在恰當(dāng)?shù)臅r(shí)候及時(shí)展現(xiàn)在合適的用戶面前,知識(shí)倉庫應(yīng)能按預(yù)定的知識(shí)描述格式提取關(guān)鍵字并與知識(shí)倉庫中相應(yīng)問題的解決方案進(jìn)行匹配,將用戶感興趣的知識(shí)自動(dòng)、及時(shí)的推送到用戶界面。
8.企業(yè)知識(shí)倉庫的設(shè)計(jì)
1.知識(shí)倉庫的體系結(jié)構(gòu)設(shè)計(jì)
知識(shí)倉庫的體系結(jié)構(gòu)不存在統(tǒng)一的模式,它的內(nèi)容應(yīng)該是活潑的,依組織的具體情況而定。然而這不是說知識(shí)倉庫的體系結(jié)構(gòu)沒有模式可循,實(shí)際上,存在著多個(gè)合理的模式可供選擇。
這里提出一個(gè)基于智力動(dòng)產(chǎn)價(jià)值提升理論(圖1)的新的知識(shí)倉庫體系結(jié)構(gòu)模型(圖2),此模型分為三層。
(1)知識(shí)庫和知識(shí)裝入代理組成的數(shù)據(jù)、信息層。
(2)知識(shí)引擎組成的知識(shí)層。
(3)分析工具、檢索工具等組成的激活層。
描述知識(shí)及其關(guān)聯(lián)背景的元數(shù)據(jù)作為共享資源貫穿各層。組織的數(shù)據(jù)、信息經(jīng)過這三層的加工、處理,以活化的知識(shí)(即情報(bào))的形式呈現(xiàn)給用戶,支持用戶的學(xué)習(xí)和決策。
數(shù)據(jù)、信息層負(fù)責(zé)知識(shí)的捕獲、組織與存儲(chǔ),包括知識(shí)庫和知識(shí)裝入代理。知識(shí)庫可分為方法庫、模型庫、數(shù)據(jù)庫、文檔庫等,并可根據(jù)組織的知識(shí)構(gòu)成情況加以增減。知識(shí)裝入代理可以是知識(shí)工人與智能代理程序組成的人機(jī)系統(tǒng),它主動(dòng)地掃描、分析組織的知識(shí)資源,發(fā)現(xiàn)知識(shí)單元及其相互之間的聯(lián)系,對(duì)知識(shí)單元進(jìn)行分類組織,裝入知識(shí)庫,同時(shí)把知識(shí)單元之間的聯(lián)系裝入元數(shù)據(jù)。知識(shí)裝入代理也負(fù)責(zé)對(duì)知識(shí)庫的維護(hù),發(fā)現(xiàn)并剔除過時(shí)的知識(shí)。
知識(shí)層負(fù)責(zé)知識(shí)單元的動(dòng)態(tài)連接,即把知識(shí)與其背景一同呈現(xiàn)出來。知識(shí)層的主要部件是知識(shí)引擎,是一個(gè)利用了人工智能技術(shù)的計(jì)算機(jī)程序。它接受來自激活層的訪問請(qǐng)求,然后分析元數(shù)據(jù)中對(duì)于相關(guān)知識(shí)單元之間聯(lián)系的描述,將知識(shí)庫中的相關(guān)知識(shí)單元?jiǎng)討B(tài)地連接起來,提交給激活層。它主要采用神經(jīng)網(wǎng)絡(luò)算法,將激活層的檢索請(qǐng)求與知識(shí)單元進(jìn)行匹配,然后存儲(chǔ)匹配過程,并根據(jù)用戶的確認(rèn)調(diào)整神經(jīng)網(wǎng)絡(luò)的內(nèi)部權(quán)值。
激活層負(fù)責(zé)知識(shí)的表現(xiàn),也可以叫做用戶接口層。它包括分析平臺(tái)、檢索平臺(tái)、重組平臺(tái)、推送平臺(tái)等,可根據(jù)實(shí)際需要加以增減。分析平臺(tái)面向決策人員,需要采用多種人工智能技術(shù),包括神經(jīng)網(wǎng)絡(luò)、遺傳算法、基于事例的推理等。由于各種算法應(yīng)用的范圍不同,因此,平臺(tái)還需要具有根據(jù)環(huán)境調(diào)度各種算法的能力。檢索平臺(tái)面向組織的知識(shí)參考需求,可采用自然語言檢索的方式,減輕用戶的智力負(fù)擔(dān)。重組平臺(tái)主要面向組織的個(gè)性化學(xué)習(xí)需求,它可以根據(jù)學(xué)習(xí)主體的情況,將相關(guān)知識(shí)重新組合,生成個(gè)性化的教材。推送平臺(tái)使用戶可以訂閱感興趣的信息或知識(shí),通過各種終端(PC,PDA等)隨時(shí)隨地接收信息。
元數(shù)據(jù)是此模型中非常重要的一個(gè)部分。作為各層的共享資源,它記錄了知識(shí)庫中裝入數(shù)據(jù)的來源、描述以及知識(shí)單元之間的關(guān)聯(lián)。
2.知識(shí)倉庫的主題劃分
由于知識(shí)倉庫是面向主題的,因此知識(shí)倉庫設(shè)計(jì)的第一項(xiàng)要完成的任務(wù)就是對(duì)系統(tǒng)主題進(jìn)行劃分。知識(shí)倉庫的分析主題應(yīng)該涵蓋企業(yè)方方面面的知識(shí),而且,不同企業(yè)需求不同,對(duì)知識(shí)倉庫主題的劃分的角度也有所不同,在這里,本文僅從支撐經(jīng)營(yíng)運(yùn)作的角度對(duì)知識(shí)進(jìn)行劃分(如圖3)。
3.知識(shí)倉庫的概念模型設(shè)計(jì)
概念模型是一種面向問題的數(shù)據(jù)模型,它描述了從用戶角度看到的知識(shí)倉庫的內(nèi)容及其聯(lián)系,是一種純粹的現(xiàn)實(shí)反應(yīng),而與存貯結(jié)構(gòu)、存取方式等知識(shí)倉庫的具體實(shí)現(xiàn)內(nèi)容無關(guān)。概念模型是聯(lián)系主觀與客觀的橋梁,它是一個(gè)為一定的目標(biāo)設(shè)計(jì)系統(tǒng)、收集信息而服務(wù)的概念型工具。具體到計(jì)算機(jī)系統(tǒng)中,概念模型是客觀世界到計(jì)算機(jī)世界的一個(gè)中間層次。
知識(shí)概念模型的設(shè)計(jì)需要給出一個(gè)知識(shí)倉庫的粗略藍(lán)本,以此為工具來判定設(shè)計(jì)者是否已經(jīng)正確地了解知識(shí)倉庫最終用戶的信息需求。在概念模型設(shè)計(jì)階段,主要完成星型模型和雪花模型的設(shè)計(jì)。
4.知識(shí)倉庫的邏輯模型設(shè)計(jì)
邏輯模型亦可稱為中間層數(shù)據(jù)模型,它是對(duì)高層的細(xì)分。盡管應(yīng)用星型模型和雪花模型可以在概念模型設(shè)計(jì)中建立數(shù)據(jù)倉庫的概念模型,但是無法直接依靠概念模型實(shí)現(xiàn)數(shù)據(jù)倉庫的物理模型,還要依靠邏輯模型作為概念模型到物理模型轉(zhuǎn)換的橋梁。
知識(shí)倉庫一般都建立在關(guān)系數(shù)據(jù)基礎(chǔ)上,因此,數(shù)據(jù)倉庫設(shè)計(jì)過程中所采用的邏輯模型主要是關(guān)系模型。但是,不同的機(jī)器系統(tǒng)又有許多不同的限制,提供不同的環(huán)境與工具。所以,在進(jìn)行邏輯模型設(shè)計(jì)時(shí)一般要分三步進(jìn)行。
(1)將概念模型轉(zhuǎn)化為一般的關(guān)系模型。一般情況下,我們都是由E-R圖轉(zhuǎn)換導(dǎo)出關(guān)系數(shù)據(jù)模型。由于關(guān)系模型的邏輯結(jié)構(gòu)是一組關(guān)系模式的集合,而E-R圖則是由實(shí)體、實(shí)體的屬性和實(shí)體之間的聯(lián)系三個(gè)要素組成的,所以將E-R圖轉(zhuǎn)化為關(guān)系模型實(shí)際就是要將實(shí)體、實(shí)體的屬性和實(shí)體之間的聯(lián)系轉(zhuǎn)化為關(guān)系模式。
(2)將轉(zhuǎn)化的關(guān)系模型向特定的數(shù)據(jù)倉庫支持下的數(shù)據(jù)模型轉(zhuǎn)換。這一步轉(zhuǎn)化是依賴于機(jī)器的,沒有普遍的規(guī)則,轉(zhuǎn)換的主要依據(jù)是知識(shí)倉庫的功能及限制。
(3)對(duì)數(shù)據(jù)模型進(jìn)行優(yōu)化。由于知識(shí)倉庫的邏輯設(shè)計(jì)的結(jié)果不是唯一的。為了進(jìn)一步提高知識(shí)倉庫的系統(tǒng)性能,還應(yīng)當(dāng)適當(dāng)?shù)男薷?、調(diào)整數(shù)據(jù)模型的結(jié)構(gòu),主要為:確定數(shù)據(jù)依賴,并對(duì)數(shù)據(jù)依賴進(jìn)行最小化處理、消除冗余關(guān)系等等。
9.知識(shí)倉庫管理技術(shù)
(1)、決策支持
決策支持工具是將知識(shí)倉庫與現(xiàn)實(shí)應(yīng)用相互關(guān)系的工具,知識(shí)倉庫利用已有的知識(shí),按照相應(yīng)的條件約束,對(duì)某一問題可以作以輔導(dǎo)決策,這其中應(yīng)用到人工智能技術(shù)、專家系統(tǒng)技術(shù)、軟件工程技術(shù),也是知識(shí)倉庫今后發(fā)展的主要利用方向[2]。其包括知識(shí)查詢工具、知識(shí)解釋工具、多維分析工具和知識(shí)控屬工具。知識(shí)查詢指以某種檢索條件為依據(jù)而提出的一般知識(shí)請(qǐng)求,知識(shí)解釋則是對(duì)知識(shí)處理和可視化知識(shí)的展現(xiàn)(如統(tǒng)計(jì)分析等)。
知識(shí)多維分析是指從業(yè)務(wù)角度對(duì)數(shù)據(jù)聚集的分析,又稱隨機(jī)分析處理(OLAP)。由于軟件技術(shù)和工具軟件的不斷改進(jìn),多維聯(lián)機(jī)可以更準(zhǔn)確、更直接、更直觀的將知識(shí)所蘊(yùn)含的內(nèi)涵作用顯現(xiàn)出來。
知識(shí)發(fā)現(xiàn)通常稱為數(shù)據(jù)挖掘,也叫信息發(fā)現(xiàn),在一般的業(yè)務(wù)分析中,最終用戶頭腦中已經(jīng)有了具體的問題,例如:"8月份某產(chǎn)品銷售了多少?"這一問題借助決策支持工具可以方便的從知識(shí)倉庫查到相應(yīng)的信息以及歷史情況曲線分析、可能存在或面臨的問題,目前的數(shù)據(jù)挖掘工具主要有數(shù)據(jù)關(guān)聯(lián)、順序狹義、分類器和聚類技術(shù)。知識(shí)發(fā)現(xiàn)的方法和實(shí)施過程:從技術(shù)上講,發(fā)掘的實(shí)施大體可以分為五個(gè)步驟:
- 選擇和準(zhǔn)備發(fā)掘的數(shù)據(jù);
- 預(yù)處理;
- 研究開發(fā)一種或多種數(shù)據(jù)知識(shí)挖掘工具;
- 發(fā)現(xiàn)未知知識(shí);
- 運(yùn)用已發(fā)現(xiàn)的知識(shí)于決策支持,達(dá)到特定目標(biāo)。
(3)、WWW與知識(shí)倉庫的融合
WWW技術(shù)的飛速發(fā)展,對(duì)知識(shí)倉庫的發(fā)展產(chǎn)生很大影響。首先是基于Web的決策支持工具的出現(xiàn),改變了用戶對(duì)知識(shí)倉庫的使用方式,不同局限于某一范圍獲得的知識(shí),而是通過Internet/Intranet遠(yuǎn)程訪問知識(shí)倉庫。其次用于訪問知識(shí)倉庫的信息目錄也可以通過Web瀏覽器來查詢和發(fā)布知識(shí),這種方式極大程度上使知識(shí)倉庫技術(shù)通過WWW更能擴(kuò)大其應(yīng)用范圍。
10.知識(shí)倉庫的標(biāo)準(zhǔn)化與安全性
通常說來,知識(shí)倉庫的標(biāo)準(zhǔn)化分為兩個(gè)方面:知識(shí)倉庫的標(biāo)準(zhǔn)化和軟件系統(tǒng)的標(biāo)準(zhǔn)化。知識(shí)倉庫是以數(shù)字化資源為基本素材,數(shù)字化資源的本身已經(jīng)相對(duì)標(biāo)準(zhǔn)化,決定了其標(biāo)準(zhǔn)化的方向。 作為知識(shí)倉庫中的主要部分軟件系統(tǒng),其標(biāo)準(zhǔn)化的程度在某種意義上更是重要,它負(fù)責(zé)知識(shí)倉庫與信息系統(tǒng)的知識(shí)接口問題,在建立的過程中,力求達(dá)到知識(shí)的通用接口,使知識(shí)倉庫的資源采集、加工、處理、輸出等接口都達(dá)到與信息系統(tǒng)的通用與兼容。
知識(shí)是構(gòu)筑一切的基礎(chǔ),并非是無國(guó)界的,或者是公開的技術(shù),對(duì)于我們的知識(shí)倉庫,存在一些非常嚴(yán)重的課題,就是安全性?,F(xiàn)今的知識(shí)倉庫,CNKI都會(huì)受到外界的干擾、人為的惡意入侵與破壞:
- 計(jì)算機(jī)病毒;
- 芯片掏鬼活動(dòng);
- 高能非核電磁脈沖;
- 微米納米機(jī)器人和芯片細(xì)菌;
- 黑客。
對(duì)于知識(shí)倉庫技術(shù)安全性的問題,應(yīng)有幾點(diǎn)考慮:
(1)對(duì)于病毒,防范是權(quán)宜之計(jì),關(guān)鍵立足長(zhǎng)遠(yuǎn),加強(qiáng)研究,積極迎接病毒對(duì)信息化社會(huì)的嚴(yán)重威脅和挑戰(zhàn)。
(2)統(tǒng)籌計(jì)劃,研究對(duì)抗技術(shù)。
(3)開展計(jì)算機(jī)病毒的專題研究
總之,知識(shí)倉庫的發(fā)展將是信息化社會(huì)的知識(shí)發(fā)展的趨勢(shì),向著智能化、網(wǎng)絡(luò)化發(fā)展,是未來智能信息系統(tǒng)的支撐環(huán)境。