登錄

多維聯(lián)機(jī)分析處理

百科 > 信息技術(shù) > 多維聯(lián)機(jī)分析處理

1.什么是多維聯(lián)機(jī)分析處理

多維聯(lián)機(jī)分析處理(多維OLAP)是一個(gè)直接編入多維數(shù)據(jù)庫聯(lián)機(jī)分析處理(OLAP)。一般來說,一個(gè)OLAP應(yīng)用程序以多維方式處理數(shù)據(jù)。用戶可以觀察數(shù)據(jù)集合體的不同方面,例如銷售時(shí)間,地點(diǎn)和產(chǎn)品模型。如果數(shù)據(jù)貯存在相關(guān)的數(shù)據(jù)庫里,那么它能被多維的觀察,但是只能用連續(xù)的訪問和處理數(shù)據(jù)集合體的一個(gè)方面的表格的方式。MOLAP處理已經(jīng)存貯在多維列表里的數(shù)據(jù),在列表里數(shù)據(jù)可能的結(jié)合都被考慮,每個(gè)數(shù)據(jù)都在一個(gè)能夠直接訪問的單元里。因?yàn)檫@個(gè)原因,對大多數(shù)用途來說,MOLAP都比關(guān)系型聯(lián)機(jī)分析處理(Relational Online Analytical Processing)要更快和更受用戶歡迎。也有HOLAP(混合OLAP),結(jié)合了ROLAP和MOLAP的一些特性。

多維OLAP,基于多維數(shù)據(jù)存儲的在線分析處理,MOLAP服務(wù)器提供數(shù)據(jù)存儲管理,一般是放在物理的“立方塊(Cube)”當(dāng)中。

MOLAP常常用作數(shù)據(jù)倉庫應(yīng)用程序的一部分。

MOLAP使用一種持久穩(wěn)固的立方體結(jié)構(gòu),與關(guān)系型數(shù)據(jù)庫是分離的。Hyperion Essbase、Microsoft Analysis Services、Cognos PowerPlay都是使用了這種方法。因?yàn)橐粋€(gè)立方體包含一個(gè)預(yù)先計(jì)算好的數(shù)據(jù)子集,所以與DOLAP和ROLAP相比響應(yīng)時(shí)間更快速且可以預(yù)測。 MOLAP數(shù)據(jù)庫傳統(tǒng)上還具有更大程度的多維計(jì)算,比ROLAP中也更容易實(shí)現(xiàn)。例如,Hyperion Essbase使用一個(gè)@DESCENDANTS功能,讓你將一個(gè)特定級別中的成員指向同一層次(如,一月、二月、三月并列是第一季度的下一級)。盡管一些關(guān)系數(shù)據(jù)庫具有CASE功能,也可以使你在一個(gè)計(jì)算中指向這些行,但并不是所有都能做到,而且計(jì)算并不一定都是直截了當(dāng)。

MOLAP的大幅下降是因?yàn)樗切枰狪T支持、管理、維護(hù)的另外一種數(shù)據(jù)存儲。公司抱怨維護(hù)200個(gè)立方體需要很多努力,或公司擁有的是花費(fèi)一個(gè)星期重新計(jì)算的設(shè)計(jì)不良的立方體,這都是很平常的。當(dāng)一個(gè)維空間改變,如增加一個(gè)新的產(chǎn)品或改組業(yè)務(wù)單元,你可能就不得不重新計(jì)算整個(gè)MOLAP立方體。

MOLAP是事先生成多維立方體,供以后查詢分析用,而ROLAP是通過動(dòng)態(tài)的生成Sql,去做查詢關(guān)系型數(shù)據(jù)庫,如果沒有做性能優(yōu)化,數(shù)據(jù)量很大的時(shí)候,性能問題就會(huì)顯得比較突出了。

以多維數(shù)據(jù)組織方式為核心,也就是說,MOLAP使用多維數(shù)組存儲數(shù)據(jù)。多維數(shù)據(jù)在存儲中將形成“立方塊(Cube)”的結(jié)構(gòu),在MOLAP中對“立方塊”的“旋轉(zhuǎn)”、“切塊”、“切片”是產(chǎn)生多維數(shù)據(jù)報(bào)表的主要技術(shù)。

2.多維聯(lián)機(jī)分析處理的特點(diǎn)

在MOLAP中,不但把多維實(shí)視圖在概念上看成一個(gè)超立方體,而且在物理上把多維實(shí)視圖組成一個(gè)多維數(shù)據(jù)庫,而不像ROLAP那樣,以表的形式存儲實(shí)視圖。

在MOLAP中,維的屬性值被映射成多維數(shù)組的下標(biāo)值或下標(biāo)的范圍,而總結(jié)數(shù)據(jù)作為多維數(shù)組的值存儲在數(shù)據(jù)的單元中。維可以看作為自變量,總結(jié)數(shù)據(jù)稱為因變量。自變量相當(dāng)于關(guān)系中的主關(guān)鍵字,由多個(gè)維組成,總結(jié)數(shù)據(jù)是由自變量的值決定的。

ROLAP在節(jié)省存儲空間、靈活性、與關(guān)系數(shù)據(jù)庫保持一致等方面有明顯的優(yōu)勢;MOLAP則在性能和管理的簡便性方面有其優(yōu)點(diǎn)。雖然MOLAP的查詢速度比較快,但是在實(shí)現(xiàn)時(shí)也有下面3方面的限制:

 1) 用多維數(shù)組實(shí)現(xiàn)多維實(shí)視圖,需要很大的存儲空間。在實(shí)際的數(shù)據(jù)倉庫中,每維的屬性值個(gè)數(shù)可達(dá)數(shù)萬,乃至更多。例如幾萬種產(chǎn)品、幾萬個(gè)連鎖店等。而實(shí)際的維數(shù)可能多達(dá)幾十乃至幾百。耗費(fèi)的存儲空間相當(dāng)可觀,由此帶來加載、維護(hù)等問題。

 2) 在多維數(shù)組中,很可能有些單元是空白的,例如節(jié)假日商店不營業(yè);某些產(chǎn)品在某些地區(qū)不銷售等。

 3) MOLAP與關(guān)系數(shù)據(jù)庫系統(tǒng)從存儲結(jié)構(gòu)到查詢語言都有相當(dāng)大的差別,不可能在RDBMS的基礎(chǔ)上實(shí)現(xiàn)。

3.多維聯(lián)機(jī)分析處理與關(guān)系型聯(lián)機(jī)分析處理比較

RolapMolap
沿用現(xiàn)有的關(guān)系數(shù)據(jù)庫的技術(shù)專為olap所設(shè)計(jì)
響應(yīng)速度比molap慢:現(xiàn)有關(guān)系型數(shù)據(jù)庫已經(jīng)對olap做了很多優(yōu)化,包括并行存儲、并行查詢、并行數(shù)據(jù)管理、基于成本的查詢優(yōu)化、位圖索引、sql 的olap擴(kuò)展(cube,rollup)等,性能有所提高性能好、響應(yīng)速度快
數(shù)據(jù)裝載速度快數(shù)據(jù)裝載速度慢
存儲空間耗費(fèi)小,維數(shù)沒有限制需要進(jìn)行預(yù)計(jì)算,可能導(dǎo)致數(shù)據(jù)爆炸,維數(shù)有限;無法支持維的動(dòng)態(tài)變化
借用rdbms存儲數(shù)據(jù),沒有文件大小限制受操作系統(tǒng)平臺中文件大小的限制,難以達(dá)到tb 級(只能10~20g)
可以通過結(jié)構(gòu)化查詢語言(sql)實(shí)現(xiàn)詳細(xì)數(shù)據(jù)與概要數(shù)據(jù)的存儲缺乏數(shù)據(jù)模型和數(shù)據(jù)訪問的標(biāo)準(zhǔn)
不支持有關(guān)預(yù)計(jì)算的讀寫操作:sql無法完成部分計(jì)算;無法完成多行的計(jì)算;無法完成維之間的計(jì)算支持高性能的決策支持計(jì)算:復(fù)雜的跨維計(jì)算;多用戶的讀寫操作;行級的計(jì)算
維護(hù)困難管理簡便
評論  |   0條評論