登錄

數(shù)據(jù)整合

百科 > 信息管理術(shù)語(yǔ) > 數(shù)據(jù)整合

1.什么是數(shù)據(jù)整合

  數(shù)據(jù)整合是把在不同數(shù)據(jù)源的數(shù)據(jù)收集、整理、清洗,轉(zhuǎn)換后(有點(diǎn)像ETL)加載到一個(gè)新的數(shù)據(jù)源,為數(shù)據(jù)消費(fèi)者提供統(tǒng)一數(shù)據(jù)視圖的數(shù)據(jù)集成方式。

  數(shù)據(jù)整合和數(shù)據(jù)集成(data integration)的區(qū)別在于:數(shù)據(jù)整合是單純的數(shù)據(jù)整合,而數(shù)據(jù)集成的涵蓋范圍要比數(shù)據(jù)整合要廣。另外由于國(guó)內(nèi)翻譯的原因,很多時(shí)候數(shù)據(jù)整合和數(shù)據(jù)集成的概念有些混淆 數(shù)據(jù)整合和數(shù)據(jù)聯(lián)邦的區(qū)別在于,數(shù)據(jù)整合需要一個(gè)實(shí)際的物理數(shù)據(jù)源來(lái)作為統(tǒng)一數(shù)據(jù)視圖的數(shù)據(jù)來(lái)源。

2.數(shù)據(jù)整合的優(yōu)點(diǎn)

  1.底層數(shù)據(jù)結(jié)構(gòu)的透明:為數(shù)據(jù)訪問(消費(fèi)應(yīng)用)提供了統(tǒng)一的接口,消 費(fèi)應(yīng)用無(wú)需知道:數(shù)據(jù)在哪里保存;源數(shù)據(jù)庫(kù)支持那種方式的訪問(XQuery,SQL);數(shù)據(jù)的物理結(jié)構(gòu);網(wǎng)絡(luò)協(xié)議等。

  2.性能和擴(kuò)展性:數(shù)據(jù)整合把數(shù)據(jù)集成和數(shù)據(jù)訪問分成了兩個(gè)過程,因此 訪問時(shí)數(shù)據(jù)已經(jīng)處于準(zhǔn)備好的狀態(tài). 3.提供真正的單一數(shù)據(jù)視圖,數(shù)據(jù)視圖data view這個(gè)概念大家很容易理解, 數(shù)據(jù)整合(Data Consolidation)的優(yōu)勢(shì)是經(jīng)過了數(shù)據(jù)校驗(yàn)和數(shù)據(jù)清理,你看到的數(shù)據(jù)更加真實(shí),準(zhǔn)確,可靠

  4.可重用性好:由于有了實(shí)際的物理存儲(chǔ),數(shù)據(jù)可以為各種應(yīng)用提供可重 用的數(shù)據(jù)視圖,而不用擔(dān)心底層實(shí)際的數(shù)據(jù)源的可用性。

  5.數(shù)據(jù)管控能力加強(qiáng): 管控是SOA里面重要的概念。數(shù)據(jù)整合(Data Consolidation)的優(yōu)勢(shì)是數(shù)據(jù)規(guī)則可以在數(shù)據(jù)加載,轉(zhuǎn)換中實(shí)施,保證了數(shù)據(jù)管控。

3.數(shù)據(jù)整合的缺點(diǎn)

  1.由于有了ETL的過程,很難保證數(shù)據(jù)的實(shí)時(shí)性。

  2.另外數(shù)據(jù)的物理備份,對(duì)于實(shí)施成本也相應(yīng)的增加了不少。

評(píng)論  |   0條評(píng)論