登錄

數(shù)據(jù)整合

百科 > 信息管理術(shù)語 > 數(shù)據(jù)整合

1.什么是數(shù)據(jù)整合

  數(shù)據(jù)整合是把在不同數(shù)據(jù)源的數(shù)據(jù)收集、整理、清洗,轉(zhuǎn)換后(有點像ETL)加載到一個新的數(shù)據(jù)源,為數(shù)據(jù)消費者提供統(tǒng)一數(shù)據(jù)視圖的數(shù)據(jù)集成方式。

  數(shù)據(jù)整合和數(shù)據(jù)集成(data integration)的區(qū)別在于:數(shù)據(jù)整合是單純的數(shù)據(jù)整合,而數(shù)據(jù)集成的涵蓋范圍要比數(shù)據(jù)整合要廣。另外由于國內(nèi)翻譯的原因,很多時候數(shù)據(jù)整合和數(shù)據(jù)集成的概念有些混淆 數(shù)據(jù)整合和數(shù)據(jù)聯(lián)邦的區(qū)別在于,數(shù)據(jù)整合需要一個實際的物理數(shù)據(jù)源來作為統(tǒng)一數(shù)據(jù)視圖的數(shù)據(jù)來源。

2.數(shù)據(jù)整合的優(yōu)點

  1.底層數(shù)據(jù)結(jié)構(gòu)的透明:為數(shù)據(jù)訪問(消費應(yīng)用)提供了統(tǒng)一的接口,消 費應(yīng)用無需知道:數(shù)據(jù)在哪里保存;源數(shù)據(jù)庫支持那種方式的訪問(XQuery,SQL);數(shù)據(jù)的物理結(jié)構(gòu);網(wǎng)絡(luò)協(xié)議等。

  2.性能和擴展性:數(shù)據(jù)整合把數(shù)據(jù)集成和數(shù)據(jù)訪問分成了兩個過程,因此 訪問時數(shù)據(jù)已經(jīng)處于準(zhǔn)備好的狀態(tài). 3.提供真正的單一數(shù)據(jù)視圖,數(shù)據(jù)視圖data view這個概念大家很容易理解, 數(shù)據(jù)整合(Data Consolidation)的優(yōu)勢是經(jīng)過了數(shù)據(jù)校驗和數(shù)據(jù)清理,你看到的數(shù)據(jù)更加真實,準(zhǔn)確,可靠

  4.可重用性好:由于有了實際的物理存儲,數(shù)據(jù)可以為各種應(yīng)用提供可重 用的數(shù)據(jù)視圖,而不用擔(dān)心底層實際的數(shù)據(jù)源的可用性。

  5.數(shù)據(jù)管控能力加強: 管控是SOA里面重要的概念。數(shù)據(jù)整合(Data Consolidation)的優(yōu)勢是數(shù)據(jù)規(guī)則可以在數(shù)據(jù)加載,轉(zhuǎn)換中實施,保證了數(shù)據(jù)管控。

3.數(shù)據(jù)整合的缺點

  1.由于有了ETL的過程,很難保證數(shù)據(jù)的實時性。

  2.另外數(shù)據(jù)的物理備份,對于實施成本也相應(yīng)的增加了不少。

評論  |   0條評論