登錄

數(shù)據(jù)冗余

百科 > 信息管理術(shù)語 > 數(shù)據(jù)冗余

1.什么是數(shù)據(jù)冗余

  數(shù)據(jù)冗余是指同一個數(shù)據(jù)系統(tǒng)中多次重復(fù)出現(xiàn)。在文件系統(tǒng)中,由于文件之間沒有聯(lián)系,有時一個數(shù)據(jù)在多個文件中出現(xiàn);而數(shù)據(jù)庫系統(tǒng)則克服了文件系統(tǒng)的這種缺陷,但仍然存在數(shù)據(jù)冗余問題。[1]消除數(shù)據(jù)冗余的目的是為了避免更新時可能出現(xiàn)的問題,以便保持?jǐn)?shù)據(jù)的一致性。[2]

2.數(shù)據(jù)冗余的類型[3]

  一般而言圖像、視頻、音頻數(shù)據(jù)中存在的數(shù)據(jù)冗余類型主要有以下一些:

  ①空間冗余:圖像數(shù)據(jù)中所經(jīng)常出現(xiàn)的一種冗余。在同一幅圖像中,規(guī)則物體和規(guī)則背景(所謂規(guī)則是指表面是有序的而不是完全雜亂無章的排列)的表面物理特性具有相關(guān)性,數(shù)字化圖像中表現(xiàn)為數(shù)據(jù)冗余。例如一幅靜態(tài)圖像中的一大片藍(lán)天、草地,其中每個像素的數(shù)據(jù)完全相同,如果逐點存儲,就會產(chǎn)生所謂的空間冗余。完全一樣的數(shù)據(jù)當(dāng)然可以壓縮,十分接近的數(shù)據(jù)也可以壓縮,因為被壓縮的數(shù)據(jù)恢復(fù)后人眼也分辨不出與原來的圖片有什么區(qū)別,這種壓縮就是對空間冗余的壓縮。

  ②時間冗余:這是序列圖像(電視圖像、運動圖像)和語音數(shù)據(jù)中所經(jīng)常包含的冗余。在電視、動畫圖像中,在相鄰幀之間往往包含了相同的背景,只不過運動物體的位置略又變換。因此對于序列圖像中的相鄰兩幀僅記錄它們之間的差異,去掉其中重復(fù)的,稱為時間冗余的那部分信息。同樣,由于人在說話時產(chǎn)生的音頻也是連續(xù)和漸變的,因此聲音信息中也會存在時間冗余。

  ③結(jié)構(gòu)冗余:有些圖像從大體上看存在著非常強的紋理結(jié)構(gòu),例如草席圖像,我們稱之為它在結(jié)構(gòu)上存在冗余。

  ④知識冗余:有許多圖像的理解與某些基礎(chǔ)知識有相當(dāng)大的相關(guān)性。例如:人臉的圖像有固定的結(jié)構(gòu)。比如說嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于臉的中線上等等。這類規(guī)律性的結(jié)構(gòu)可由先驗知識和背景知識得到,稱之為知識冗余。⑤視覺冗余:是由于人體器官的不敏感性造成的。例如在高亮度下,人的視覺靈敏度下降,對灰度值的表示就可以粗糙一些。對于太強太弱的聲音,如果超出了“閾值”,人們聽覺感受也會被掩蔽。利用感官上的這些特性,也可以壓縮掉部分?jǐn)?shù)據(jù)而不被人們感知(覺察)。

  ⑥信息熵冗余:又可稱為編碼冗余,是指一組數(shù)據(jù)攜帶的平均信息量。正因為多媒體數(shù)據(jù)中存在著上述的各種各樣的冗余,所以多媒體數(shù)據(jù)是可以被壓縮的。針對不同的冗余,人們已經(jīng)提出各種各樣的方法實施對于多媒體數(shù)據(jù)的壓縮。

3.增加數(shù)據(jù)冗余的目的[4]

  一般情況下,應(yīng)盡量減少數(shù)據(jù)冗余,保證數(shù)據(jù)的一致性,但在某些情況下,也需要適當(dāng)增加數(shù)據(jù)冗余度。

  1、重復(fù)存儲或傳輸數(shù)據(jù)以防止數(shù)據(jù)的丟失。

  2、對數(shù)據(jù)進行冗余性的編碼來防止數(shù)據(jù)的丟失、錯誤,并提供對錯誤數(shù)據(jù)進行反變換得到原始數(shù)據(jù)的功能。

  3、為方便處理而使同一信息在不同地點有不同的表現(xiàn)形式,如一本書的不同語言的版本。

  4、為了提高數(shù)據(jù)的檢索速度。

  數(shù)據(jù)冗余或者信息冗余是生產(chǎn)、生活所必然存在的行為,沒有好與不好的總體傾向。

評論  |   0條評論