登錄

數(shù)據(jù)可視化

百科 > 信息管理術(shù)語(yǔ) > 數(shù)據(jù)可視化

1.什么是數(shù)據(jù)可視化

  數(shù)據(jù)可視化是關(guān)于數(shù)據(jù)之視覺(jué)表現(xiàn)形式的研究;其中,這種數(shù)據(jù)的視覺(jué)表現(xiàn)形式被定義為一種以某種概要形式抽提出來(lái)的信息,包括相應(yīng)信息單位的各種屬性和變量。

  數(shù)據(jù)可視化主要旨在借助于圖形化手段,清晰有效地傳達(dá)與溝通信息。但是,這并不就意味著,數(shù)據(jù)可視化就一定因?yàn)橐獙?shí)現(xiàn)其功能用途而令人感到枯燥乏味,或者是為了看上去絢麗多彩而顯得極端復(fù)雜。為了有效地傳達(dá)思想概念,美學(xué)形式與功能需要齊頭并進(jìn),通過(guò)直觀地傳達(dá)關(guān)鍵的方面與特征,從而實(shí)現(xiàn)對(duì)于相當(dāng)稀疏而又復(fù)雜的數(shù)據(jù)集的深入洞察。然而,設(shè)計(jì)人員往往并不能很好地把握設(shè)計(jì)與功能之間的平衡,從而創(chuàng)造出華而不實(shí)的數(shù)據(jù)可視化形式,無(wú)法達(dá)到其主要目的,也就是傳達(dá)與溝通信息。

  數(shù)據(jù)可視化與信息圖形、信息可視化、科學(xué)可視化以及統(tǒng)計(jì)圖形密切相關(guān)。當(dāng)前,在研究、教學(xué)和開(kāi)發(fā)領(lǐng)域,數(shù)據(jù)可視化乃是一個(gè)極為活躍而又關(guān)鍵的方面?!皵?shù)據(jù)可視化”這條術(shù)語(yǔ)實(shí)現(xiàn)了成熟的科學(xué)可視化領(lǐng)域與較年輕的信息可視化領(lǐng)域的統(tǒng)一。

2.數(shù)據(jù)可視化的起源

  數(shù)據(jù)可視化領(lǐng)域的起源可以追溯到二十世紀(jì)50年代計(jì)算機(jī)圖形學(xué)的早期。當(dāng)時(shí),人們利用計(jì)算機(jī)創(chuàng)建出了首批圖形圖表。1987年,由布魯斯·麥考梅克、托馬斯·德房蒂和瑪克辛·布朗所編寫(xiě)的美國(guó)國(guó)家科學(xué)基金會(huì)報(bào)告《Visualization in Scientific Computing》(意為“科學(xué)計(jì)算之中的可視化”),對(duì)于這一領(lǐng)域產(chǎn)生了大幅度的促進(jìn)和刺激。這份報(bào)告之中強(qiáng)調(diào)了新的基于計(jì)算機(jī)的可視化技術(shù)方法的必要性。隨著計(jì)算機(jī)運(yùn)算能力的迅速提升,人們建立了規(guī)模越來(lái)越大,復(fù)雜程度越來(lái)越高的數(shù)值模型,從而造就了形形色色體積龐大的數(shù)值型數(shù)據(jù)集。同時(shí),人們不但利用醫(yī)學(xué)掃描儀和顯微鏡之類的數(shù)據(jù)采集設(shè)備產(chǎn)生大型的數(shù)據(jù)集,而且還利用可以保存文本、數(shù)值和多媒體信息的大型數(shù)據(jù)庫(kù)來(lái)收集數(shù)據(jù)。因而,就需要高級(jí)的計(jì)算機(jī)圖形學(xué)技術(shù)與方法來(lái)處理和可視化這些規(guī)模龐大的數(shù)據(jù)集。

  短語(yǔ)“Visualization in Scientific Computing”(意為“科學(xué)計(jì)算之中的可視化”)后來(lái)變成了“Scientific Visualization”(即“科學(xué)可視化”),而前者最初指的是作為科學(xué)計(jì)算之組成部分的可視化:也就是科學(xué)與工程實(shí)踐當(dāng)中對(duì)于計(jì)算機(jī)建模和模擬的運(yùn)用。更近一些的時(shí)候,可視化也日益尤為關(guān)注數(shù)據(jù),包括那些來(lái)自商業(yè)、財(cái)務(wù)、行政管理、數(shù)字媒體等方面的大型異質(zhì)性數(shù)據(jù)集合。二十世紀(jì)90年代初期,人們發(fā)起了一個(gè)新的,稱為“信息可視化”的研究領(lǐng)域,旨在為許多應(yīng)用領(lǐng)域之中對(duì)于抽象的異質(zhì)性數(shù)據(jù)集的分析工作提供支持。因此,目前人們正在逐漸接受這個(gè)同時(shí)涵蓋科學(xué)可視化與信息可視化領(lǐng)域的新生術(shù)語(yǔ)“數(shù)據(jù)可視化”。

  自那時(shí)起,數(shù)據(jù)可視化就是一個(gè)處于不斷演變之中的概念,其邊界在不斷地?cái)U(kuò)大;因而,最好是對(duì)其加以寬泛的定義。數(shù)據(jù)可視化指的是技術(shù)上較為高級(jí)的技術(shù)方法,而這些技術(shù)方法允許利用圖形、圖像處理、計(jì)算機(jī)視覺(jué)以及用戶界面,通過(guò)表達(dá)、建模以及對(duì)立體、表面、屬性以及動(dòng)畫(huà)的顯示,對(duì)數(shù)據(jù)加以可視化解釋。與立體建模之類的特殊技術(shù)方法相比,數(shù)據(jù)可視化所涵蓋的技術(shù)方法要廣泛得多。

3.數(shù)據(jù)可視化的適用范圍

  關(guān)于數(shù)據(jù)可視化的適用范圍,目前存在著不同的劃分方法。一個(gè)常見(jiàn)的關(guān)注焦點(diǎn)就是信息的呈現(xiàn)。例如,邁克爾·弗蘭德利(2008)提出了數(shù)據(jù)可視化的兩個(gè)主要的組成部分:統(tǒng)計(jì)圖形和主題圖。另外,《Data Visualization: Modern Approaches》(意為“數(shù)據(jù)可視化:現(xiàn)代方法”,2007)一文則概括闡述了數(shù)據(jù)可視化的下列主題:

  1.思維導(dǎo)圖

  2.新聞的顯示

  3.數(shù)據(jù)的顯示

  4.連接的顯示

  5.網(wǎng)站的顯示

  6.文章與資源

  7.工具與服務(wù)

  所有這些主題全都與圖形設(shè)計(jì)和信息表達(dá)密切相關(guān)。

  另一方面,F(xiàn)rits H. Post(2002)則從計(jì)算機(jī)科學(xué)的視角,將這一領(lǐng)域劃分為如下多個(gè)子領(lǐng)域:

  1.可視化算法與技術(shù)方法

  2.立體可視化

  3.信息可視化

  4.多分辨率方法

  5.建模技術(shù)方法

  6.交互技術(shù)方法與體系架構(gòu)

  數(shù)據(jù)可視化的成功應(yīng)歸于其背后基本思想的完備性:依據(jù)數(shù)據(jù)及其內(nèi)在模式和關(guān)系,利用計(jì)算機(jī)生成的圖像來(lái)獲得深入認(rèn)識(shí)和知識(shí)。其第二個(gè)前提就是利用人類感覺(jué)系統(tǒng)的廣闊帶寬來(lái)操縱和解釋錯(cuò)綜復(fù)雜的過(guò)程、涉及不同學(xué)科領(lǐng)域的數(shù)據(jù)集以及來(lái)源多樣的大型抽象數(shù)據(jù)集合的模擬。這些思想和概念極其重要,對(duì)于計(jì)算科學(xué)與工程方法學(xué)以及管理活動(dòng)都有著精深而又廣泛的影響。《Data Visualization: The State of the Art》(意為“數(shù)據(jù)可視化:尖端技術(shù)水平”)一書(shū)當(dāng)中重點(diǎn)強(qiáng)調(diào)了各種應(yīng)用領(lǐng)域與它們各自所特有的問(wèn)題求解可視化技術(shù)方法之間的相互作用。

4.數(shù)據(jù)可視化的相關(guān)領(lǐng)域

  (1)數(shù)據(jù)采集

  數(shù)據(jù)采集(有時(shí)縮寫(xiě)為DAQ或DAS),又稱為“數(shù)據(jù)獲取”或“數(shù)據(jù)收集”,是指對(duì)現(xiàn)實(shí)世界進(jìn)行采樣,以便產(chǎn)生可供計(jì)算機(jī)處理的數(shù)據(jù)的過(guò)程。通常,數(shù)據(jù)采集過(guò)程之中包括為了獲得所需信息,對(duì)于信號(hào)和波形進(jìn)行采集并對(duì)它們加以處理的步驟。數(shù)據(jù)采集系統(tǒng)的組成元件當(dāng)中包括用于將測(cè)量參數(shù)轉(zhuǎn)換成為電信號(hào)的傳感器,而這些電信號(hào)則是由數(shù)據(jù)采集硬件來(lái)負(fù)責(zé)獲取的。

  (2)數(shù)據(jù)分析

  數(shù)據(jù)分析是指為了提取有用信息和形成結(jié)論而對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過(guò)程。數(shù)據(jù)分析與數(shù)據(jù)挖掘密切相關(guān),但數(shù)據(jù)挖掘往往傾向于關(guān)注較大型的數(shù)據(jù)集,較少側(cè)重于推理,且常常采用的是最初為另外一種不同目的而采集的數(shù)據(jù)。在統(tǒng)計(jì)學(xué)領(lǐng)域,有些人將數(shù)據(jù)分析劃分為描述性統(tǒng)計(jì)分析、探索性數(shù)據(jù)分析以及驗(yàn)證性數(shù)據(jù)分析;其中,探索性數(shù)據(jù)分析側(cè)重于在數(shù)據(jù)之中發(fā)現(xiàn)新的特征,而驗(yàn)證性數(shù)據(jù)分析則側(cè)重于已有假設(shè)的證實(shí)或證偽。

  數(shù)據(jù)分析的類型包括:

  探索性數(shù)據(jù)分析:是指為了形成值得假設(shè)的檢驗(yàn)而對(duì)數(shù)據(jù)進(jìn)行分析的一種方法,是對(duì)傳統(tǒng)統(tǒng)計(jì)學(xué)假設(shè)檢驗(yàn)手段的補(bǔ)充。該方法由美國(guó)著名統(tǒng)計(jì)學(xué)家約翰·圖基命名。

  定性數(shù)據(jù)分析:又稱為“定性資料分析”、“定性研究”或者“質(zhì)性研究資料分析”,是指對(duì)諸如詞語(yǔ)、照片、觀察結(jié)果之類的非數(shù)值型數(shù)據(jù)(或者說(shuō)資料)的分析。

  (3)數(shù)據(jù)治理

  數(shù)據(jù)治理涵蓋為特定組織機(jī)構(gòu)之?dāng)?shù)據(jù)創(chuàng)建協(xié)調(diào)一致的企業(yè)級(jí)視圖(enterprise view)所需的人員、過(guò)程和技術(shù);數(shù)據(jù)治理旨在:

  增強(qiáng)決策制定過(guò)程中的一致性與信心

  降低遭受監(jiān)管罰款的風(fēng)險(xiǎn)

  改善數(shù)據(jù)的安全性

  最大限度地提高數(shù)據(jù)的創(chuàng)收潛力

  指定信息質(zhì)量責(zé)任

  (4)數(shù)據(jù)管理

  數(shù)據(jù)管理,又稱為“數(shù)據(jù)資源管理”,包括所有與管理作為有價(jià)值資源的數(shù)據(jù)相關(guān)的學(xué)科領(lǐng)域。對(duì)于數(shù)據(jù)管理,DAMA所提出的正式定義是:“數(shù)據(jù)資源管理是指用于正確管理企業(yè)或機(jī)構(gòu)整個(gè)數(shù)據(jù)生命周期需求的體系架構(gòu)、政策、規(guī)范和操作程序的制定和執(zhí)行過(guò)程”。這項(xiàng)定義相當(dāng)寬泛,涵蓋了許多可能在技術(shù)上并不直接接觸低層數(shù)據(jù)管理工作(如關(guān)系數(shù)據(jù)庫(kù)管理)的職業(yè)。

  (5)數(shù)據(jù)挖掘

  數(shù)據(jù)挖掘是指對(duì)大量數(shù)據(jù)加以分類整理并挑選出相關(guān)信息的過(guò)程。數(shù)據(jù)挖掘通常為商業(yè)智能組織和金融分析師所采用;不過(guò),在科學(xué)領(lǐng)域,數(shù)據(jù)挖掘也越來(lái)越多地用于從現(xiàn)代實(shí)驗(yàn)與觀察方法所產(chǎn)生的龐大數(shù)據(jù)集之中提取信息。

  數(shù)據(jù)挖掘被描述為“從數(shù)據(jù)之中提取隱含的,先前未知的,潛在有用信息的非凡過(guò)程”,以及“從大型數(shù)據(jù)集或數(shù)據(jù)庫(kù)之中提取有用信息的科學(xué)”。與企業(yè)資源規(guī)劃相關(guān)的數(shù)據(jù)挖掘是指對(duì)大型交易數(shù)據(jù)集進(jìn)行統(tǒng)計(jì)分析和邏輯分析,從中尋找可能有助于決策制定工作的模式的過(guò)程。

評(píng)論  |   0條評(píng)論