登錄

信息可視化

百科 > 信息管理術(shù)語 > 信息可視化

1.什么是信息可視化

  信息可視化是由斯圖爾特·卡德(Stuart K.Card)、約克·麥金利(Jock D.Mackinlay)和喬治·羅伯遜(George G.Robertson)于1989年提出的,它是一個跨學科領(lǐng)域,旨在研究大規(guī)模非數(shù)值型信息資源的視覺呈現(xiàn),如軟件系統(tǒng)之中眾多的文件或者一行行的程序代碼,以及利用圖形學的技術(shù)與方法幫助人們理解和分析數(shù)據(jù)口。

  信息可視化將數(shù)據(jù)信息和知識轉(zhuǎn)化為一種視覺形式,充分利用人們對可視模式快速識別的自然能力。從某種層面上說,任何事物都可認為是一類信息:圖形、表格、地圖以及一些加了文本的流程圖,都能為人們提供一種信息傳遞的方式或手段,甚至能表現(xiàn)出隱喻的事情。[1]

2.信息可視化的產(chǎn)生背景[2]

  信息可視化起源于多個方面。首先是1786年蘇格蘭政治經(jīng)濟學家W.Playfair在圖形數(shù)據(jù)方面的工作,他也許是最早利用線和面等可視化表示數(shù)據(jù)的人。從此,產(chǎn)生了用圖形表示數(shù)據(jù)的經(jīng)典方法。1967年,一位法國制圖工作者J.Bertin發(fā)表了他們的圖形理論。這一理論指明了圖表的基本元素,描述了圖表的設(shè)計框架。1983年美國耶魯大學統(tǒng)計學教授E.R.TuRe發(fā)表了數(shù)據(jù)圖理論。Bertin與TuRe的理論在許多領(lǐng)域是著名的和有影響的,這引起了信息可視化的大發(fā)展。在信息可視化的發(fā)展過程中,科學可視化的產(chǎn)生與發(fā)展起了決定性的推動作用?!靶畔⒖梢暬边@一術(shù)語最早出現(xiàn)在1989年G.Rob—e~son、S.Card與J.Mackinlay的論文中, 目前信息可視化已成為一個與科學可視化并列的研究領(lǐng)域。

3.信息可視化的應(yīng)用領(lǐng)域[2]

  1.信息可視化應(yīng)用的分類。馬里蘭大學教授本·施奈德曼(Ben Shneiderman)把數(shù)據(jù)分成以下七類:一維數(shù)據(jù)(1一D)、二維數(shù)據(jù)(2-D)、三維數(shù)據(jù)(3一D)、多維數(shù)據(jù)(multidimensiona1)、時態(tài)數(shù)據(jù)(TemporaD、層次數(shù)據(jù)(tree)、和網(wǎng)絡(luò)數(shù)據(jù)(Network)。信息可視化方法根據(jù)不同的數(shù)據(jù)也可劃分為以下七類:

  (1)一維信息可視化。一維信息是簡單的線性信息,如文本,或者一列數(shù)字。最通常的一維信息可能就是文本文獻了。在很多情況下,可視化文本文獻不是必要的,因為它們可以容易地被完整閱讀,或者閱讀所需要的特定部分。然而,在某些情況下,我們需要借助可視化技術(shù)增加文本信息的有效性。

  (2)二維信息可視化。在信息可視化環(huán)境中,二維信息是指包括兩個主要屬性的信息。寬度和高度可以描述事物的大小,事物在x軸和Y軸的位置表示了它在空間的定位。城市地圖和建筑平面圖都屬于二維信息可視化。

  (3)三維信息可視化。三維信息通過引入體積的概念超越了二維信息。許多科學計算可視化都是三維信息可視化,因為科學計算可視化的主要目的就是表示現(xiàn)實的三維物體。計算機模型可以讓科學家模擬試驗、操作那些現(xiàn)實世界中代價昂貴、實施困難、非常危險或者是現(xiàn)實世界中不可能進行的事情。

  (4)多維信息可視化。多維信息是指在信息可視化環(huán)境中的那些具有超過3個屬性的信息,在可視化中,這些屬性的重要性是相當重要的。

  (5)時間序列信息可視化。有些信息自身具有時間屬性,可以稱為時間序列信息。比如,一部小說或者新聞就可以有時間線。學者Liddy建立了一個從文本信息中抽取時間信息的系統(tǒng)SHESS。該系統(tǒng)自動生成一個知識庫,這個知識庫聚集了關(guān)于任何已命名的實體(人、方位、事件、組織、公司或者思想觀念)的信息,并且按照時間序列組織這些知識,這個時間序列覆蓋了知識庫的整個周期。

  (6)層次信息可視化。抽象信息之間的一種最普遍關(guān)系就是層次關(guān)系,如磁盤目錄結(jié)構(gòu)、文檔管理、圖書分類等。傳統(tǒng)的描述層次信息的方法就是將其組織成一個類似于樹的節(jié)點連接表示。這種表示結(jié)構(gòu)簡單直觀,但是,對于大型的層次結(jié)構(gòu)而言,樹形結(jié)構(gòu)的分支很快就會擁擠交織在一起,變得混亂不堪,這主要是因為層次結(jié)構(gòu)在橫向(每層節(jié)點的個數(shù))和縱向(層次結(jié)構(gòu)的層數(shù))擴展的不成比例造成的。

  (7)網(wǎng)絡(luò)信息可視化。目前,Web的信息不計其數(shù),這些信息分布在遍及世界各地的數(shù)以萬計的網(wǎng)站上,網(wǎng)站通過文檔之間的超鏈接彼此交織在一起。不論Web現(xiàn)在的規(guī)模有多大,它還將繼續(xù)膨脹。

  2.數(shù)字圖書館可視化。自美國科學家9O年代初提出了數(shù)字圖書館概念后,以驅(qū)動多媒體海量數(shù)字信息組織與互聯(lián)網(wǎng)應(yīng)用問題各方面研究的技術(shù)領(lǐng)域開始在全球迅速發(fā)展起來。將信息可視化技術(shù)引入到數(shù)字圖書館領(lǐng)域,解決信息需求與服務(wù)的個性化,信息提供的個性化等問題,可以通過信息可視化嘗試解決發(fā)展問題。這一領(lǐng)域主要關(guān)于信息檢索過程可視化和信息結(jié)果可視化。用戶作為信息使用者的同時也是信息構(gòu)建者,通過增加檢索路徑到信息空間,這些增加的路徑給其他用戶檢索其他路徑提供了有價值的信息。

4.信息可視化的發(fā)展前景[2]

  1.可視化數(shù)據(jù)挖掘(Data-mining vi suaI ization)。

  信息可視化不僅用圖像來顯示多維的非空間數(shù)據(jù),使用戶加深對數(shù)據(jù)含義的理解,而且用形象直觀的圖像來指引檢索過程,加快檢索速度。在信息可視化中,顯示的對象主要是多維的標量數(shù)據(jù),目前的研究重點在于,設(shè)計和選擇什么樣的顯示方式才能便于用戶了解龐大的多維數(shù)據(jù)及它們相互之間的關(guān)系,其中更多地涉及心理學、機交互技術(shù)等問題??梢暬瘮?shù)據(jù)挖掘是一個使用可視化技術(shù)在大量的數(shù)據(jù)中發(fā)現(xiàn)潛在有用知識的過程,它可以將許多數(shù)據(jù)同時顯示在屏幕上,并將每一個數(shù)據(jù)值映射成屏幕的一個像素。像素的顏色對應(yīng)于每個數(shù)據(jù)值或是數(shù)據(jù)值與給定查詢值之間的差值。在這種技術(shù)中,用戶由可視化的視覺反饋指導并且能更快地研究數(shù)據(jù)庫中數(shù)據(jù)的眾多特性??梢暬瘮?shù)據(jù)挖掘的關(guān)鍵技術(shù)主要包括三個方面,即交互性技術(shù)、選擇查詢技術(shù)和可視化模型。目前,可視化數(shù)據(jù)挖掘主要有兩種分類系統(tǒng),一種是Keim提出的分類體系,另外一種是Card提出的分類體系,下面分別介紹這兩種分類體系的具體內(nèi)容:

  (1)Keim的分類體系。Keim等人將面向多變量和多維信息的可視化數(shù)據(jù)挖掘技術(shù)分為六大類,包括:一是像素導向(Pixel-based)技術(shù);二是幾何映射(Geometric projecfion)技術(shù);三是圖標技術(shù)(Icon-based):四是分層技術(shù);五是圖形技術(shù);六是混合技術(shù)。

  (2)Card的分類體系。Card等人根據(jù)信息可視化的類型將可視化數(shù)據(jù)挖掘技術(shù)分為四個層次。最高層的可視化工具可以為用戶提供在其運行環(huán)境之外(如在Intemet或在線服務(wù)器上收集)進行信息收集的可視化途徑;第二層可視化工具旨在通過創(chuàng)建信息工作空間的快速獲取和高度交互的可視化表示來支持用戶執(zhí)行任務(wù)。第三層是可視化的知識工具,描述數(shù)據(jù)的可視化表達,它提供了一個控制集用以與這些可視化的表達進行交互,這就使用戶能夠確定并提取數(shù)據(jù)的關(guān)系。第四層次是增強的可視化對象,它的目標在于揭示對象內(nèi)部的一些本質(zhì)信息。

  2.可視化技術(shù)在空間信息挖掘中的應(yīng)用。

  空間數(shù)據(jù)挖掘通常以地圖應(yīng)用為主,通常表現(xiàn)為地理現(xiàn)象的分布規(guī)律、聚類規(guī)律、發(fā)展演變規(guī)律、相連共生的關(guān)聯(lián)規(guī)則等;而應(yīng)用數(shù)據(jù)挖掘在GIS遙感影象解譯中,由于同物異譜和同譜異物的存在,單純依靠光譜值知識的統(tǒng)計分類和特征提取難以滿足要求,如果能將空間目標的關(guān)聯(lián)知識考慮進去,可以大大提高自動化和準確程度。由此可見,數(shù)據(jù)挖掘與GIS集成可以根據(jù)不同的研究內(nèi)容分為面向空間要素的數(shù)據(jù)挖掘、面向非空間要素的數(shù)據(jù)挖掘和空間要素信息與非空間要素信息的聯(lián)合數(shù)據(jù)挖掘。根據(jù)不同的類型,所選的可視化技術(shù)也不相同,需要根據(jù)實際情況決定采用何種可視化數(shù)據(jù)挖掘技術(shù)。面向空間要素的數(shù)據(jù)挖掘主要是挖掘空間實體間的空間關(guān)系、空間規(guī)則和特征信息,主要從兩種數(shù)據(jù)挖掘的粒度—— 基于目標實體和柵格來考慮的。面向非空間要素的數(shù)據(jù)挖掘是對經(jīng)過空間化后的數(shù)據(jù)在非空間層次進行一般的數(shù)據(jù)挖掘,即建立在對GIS所管理的空間實體所對應(yīng)的屬性信息的數(shù)據(jù)挖掘,然后利用GIS對所挖掘的結(jié)果進行表達,是一種較低層次的數(shù)據(jù)挖掘與GIS集成應(yīng)用??臻g要素和屬性信息關(guān)聯(lián)的空間數(shù)據(jù)挖掘不同于前兩者的數(shù)據(jù)挖掘集成,它的研究內(nèi)容不僅僅局限于對地理要素的空間位置和空間關(guān)系的研究,而還包括對空間現(xiàn)象(四季變換、溫度變化、刮風降水)、空間因素(高山、谷地、平原)、空間組成(土壤、地貌、植被、水域、礦產(chǎn))、空間活動(動物變遷、人類活動、水土流失、沙漠侵蝕)等的研究,力圖從中揭示出相互影響的內(nèi)在機制與規(guī)律。

  3.KM可視化。

  (1)知識管理體系。所謂的“知識工作者”(Knowledge worker)最主要的任務(wù)之一,就是如何在做決策前已具備或搜集到所需知識。而如何利用網(wǎng)絡(luò)資源和信息技術(shù)手段,系統(tǒng)地搜尋知識、整理知識、組織知識、并最終有效地加以利用則是知識:作者必備的技能。但是純粹以文字組織知識不僅困難而且無法展現(xiàn)其全貌。特別是對隱性知識,用純文字的紀錄很難說將知識片段間錯綜復雜的關(guān)聯(lián)說清楚。思考大師狄波諾認為,避免人類浯言造成的僵化,有一個很好的辦法,就是在思考的時候,腦海里盡量多用“圖形”少用文字。一個完整的知識管理體系應(yīng)該包括:知識收集、知識提煉、知識存儲和知識應(yīng)用四個階段。這是個循環(huán)往復,螺旋上升的過程,借助可視化方法表現(xiàn)它, 可以幫助我們更準確地理解它們的相互關(guān)系,并尋找和發(fā)現(xiàn)新的可視化“隱喻”來表示知識。如前所述,知識收集,知識提煉,知識存儲和知識應(yīng)用是知識管理因為“隱性知識”要能夠轉(zhuǎn)化為“顯性知識”才能夠被紀錄保存,這個過程叫做隱形知識的“表達外化”;而“顯性知識”則經(jīng)過人類大腦的綜合組織,被作為“隱形知識’而保存在腦中。知識形態(tài)之間的轉(zhuǎn)化,需要一種視覺化模型來表達和呈現(xiàn),就好比UML(Unified Modeling Language; 統(tǒng)一建模語言)作為一種可視化建模語言,被用作軟件開發(fā)流程中的分析和設(shè)計階段一樣。

  (2)幾種已有的知識可視化工具。一是概念圖(Concept Map)。概念圖是康乃爾大學的諾瓦克(J.D.Noval0 博士(Novak,J.D.&Gowin,D.B,1984)根據(jù)奧蘇貝爾(David P.Ausube1)的有意義學習理論提出的一種教學技術(shù)。它通常將某一主題的有關(guān)概念置于圓圈或方框之中,然后用連線將相關(guān)的概念和命題連接,連線上標明兩個概念之間的意義關(guān)系。二是思維導圖(Mind Map)。思維導圖最初是20世紀60年代英國人托尼·巴贊(Tony Buzan)(1999)創(chuàng)造的一種筆記方法。托尼·巴贊認為思維導圖是對發(fā)散性思維的表達,因此也是人類思維的自然功能,是打開大腦潛能的萬能鑰匙,可以應(yīng)用于生活的各個方面。三是認知地圖(Cogui.tiveMaps)。認知地圖也被稱為因果圖(CausalMaps),是由Ackerman&Eden(2001)提出的,它將“想法”(ideas)作為節(jié)點,并將其相互連接起來。

  (3)可視化知識建模語言KML(Knowl—edge Modeling Language)。如何在浩瀚信息海洋中獲取自己所需的知識,進而進行有效的管理并最終利用知識創(chuàng)造價值是知識管理的重要目標。而如何構(gòu)建良好的知識模型來存儲和表達所需的知識,是知識創(chuàng)造價值過程的關(guān)鍵因素。針對這種需求,提出了可記錄隱性知識的可視化知識建模語言(KML),通過使用可視化知識建模語言人們可以將內(nèi)在的知識記錄轉(zhuǎn)化為圖形化的文檔,從而得以展現(xiàn)知識的全貌,而知識的使用也變得更加直觀和有效。

  4.信息可視化商品。目前,信息可視化技術(shù)的產(chǎn)品化、商品化趨勢已經(jīng)顯露出來??偟膩碚f,信息可視化技術(shù)商品化有兩種模式:一種是將信息可視化技術(shù)轉(zhuǎn)化為信息可視化產(chǎn)品,如treemap、theBrain、1N—SP1RETM等;另一種是信息可視化技術(shù)與現(xiàn)有軟件結(jié)合,即信息可視化技術(shù)被其他軟件采納,作為其他軟件的構(gòu)件而存在,可視化技術(shù)在商務(wù)智能中的應(yīng)用就屬于這種模式。

5.信息可視化與科學可視化的區(qū)別[3]

  科學可視化是空間數(shù)據(jù)場的可視化。它是人們?yōu)榱嗽谟嬎氵^程、數(shù)據(jù)處理流程中了解數(shù)據(jù)的變化情況,通過圖形、圖像、圖表以及其他可視化手段來檢查、分析處理結(jié)果數(shù)據(jù)的過程。在科學可視化中,顯示的對象涉及標量、矢量及張量等不同類別的空間數(shù)據(jù),研究的重點放在如何真實、快速地顯示三維數(shù)據(jù)場。信息可視化則是指非空間(非結(jié)構(gòu))數(shù)據(jù)的可視化,它主要是用圖像來顯示多維的非空間信息,使用戶加深對信息含義的理解,同時利用圖像的形象直觀性來指引檢索過程,加快檢索速度。在信息可視化中,顯示的對象主要是多維的標量數(shù)據(jù),其研究重點在于:設(shè)計和選擇什么樣的顯示方式才能便于用戶了解龐大的多維數(shù)據(jù)及它們相互之間的關(guān)系,這其中更多地涉及心理學知識、人機交互技術(shù)等問題。從圖形生成的角度來看,信息可視化難度要小于科學計算可視化。但是,從心理學和人機交互的角度來說,它是一個還未曾進行過充分研究的新領(lǐng)域。

  現(xiàn)在將科學可視化與信息可視化的具體區(qū)別總結(jié)如下。見下表:

科學可視化 信息可視化
目標任務(wù) 深入理解自然界中實際存在的科學現(xiàn)象 搜索、發(fā)現(xiàn)信息之間的關(guān)系和信息中隱藏的模式
數(shù)據(jù)來源 計算和工作測量中的數(shù)據(jù) 大型數(shù)據(jù)庫中的數(shù)據(jù)
數(shù)據(jù)類型 具有物理、幾何屬性的結(jié)構(gòu)化數(shù)據(jù)、仿真數(shù)據(jù)等 非結(jié)構(gòu)化數(shù)據(jù)、各種沒有幾何屬性的抽象數(shù)據(jù)
處理過程 數(shù)據(jù)預處理一映射(構(gòu)模)一繪制和顯示 信息獲取一知識信息多維顯示一知識信息分析與挖掘
研究重點 如何將具有幾何屬性的科學數(shù)據(jù)真實地表現(xiàn)在計算機屏幕上,它主要涉及計算機圖形圖像等問題題,圖形質(zhì)量是其核心問題 如何繪制所關(guān)注對象的可視化屬性等問題,更重要的問題是是把非空間抽象信息映射為有效的可視化形式,尋找合適的可視化隱喻。
主要的應(yīng)用方法 線狀圖、直方圖、等值線(面)、繪制、體繪制技術(shù) 幾何技術(shù)、基于圖標的技術(shù)、面向象素的、分級技術(shù)等
面向的用戶 高層次的、訓練有素的專家 非技術(shù)人員、普通用戶
應(yīng)用領(lǐng)域 醫(yī)學、地質(zhì)、氣象、流體力學等 信息管理、商業(yè),金融等
評論  |   0條評論