登錄

數(shù)據(jù)庫(kù)

百科 > 信息管理術(shù)語(yǔ) > 數(shù)據(jù)庫(kù)

1.什么是數(shù)據(jù)庫(kù)

數(shù)據(jù)庫(kù)是指長(zhǎng)期存儲(chǔ)在計(jì)算機(jī)內(nèi)有組織的、可共享的數(shù)據(jù)集合。數(shù)據(jù)庫(kù)中的數(shù)據(jù)按一定的數(shù)據(jù)模型組織、描述和存儲(chǔ),具有較小的冗余度、較高的數(shù)據(jù)獨(dú)立性和易擴(kuò)展性,并可為各種用戶共享。

數(shù)據(jù)庫(kù)是被長(zhǎng)期存放在計(jì)算機(jī)內(nèi)、有組織的、可以表現(xiàn)為多種形式的可共享的數(shù)據(jù)集合。這里“共享”是指數(shù)據(jù)庫(kù)中的數(shù)據(jù),可為多個(gè)不同的用戶、使用多種不同的語(yǔ)言、為了不同的目的而同時(shí)存取數(shù)據(jù)庫(kù),甚至同一塊數(shù)據(jù)也可以同時(shí)存取;“集合”是指某特定應(yīng)用環(huán)境中的各種應(yīng)用的數(shù)據(jù)及其數(shù)據(jù)之間的聯(lián)系(聯(lián)系也是一種數(shù)據(jù))全部集中地按照一定的結(jié)構(gòu)形式進(jìn)行存儲(chǔ)。

2.數(shù)據(jù)庫(kù)研究的范圍[1]

當(dāng)前,數(shù)據(jù)庫(kù)研究的范圍有以下三個(gè)領(lǐng)域。

1.數(shù)據(jù)庫(kù)管理系統(tǒng)軟件的研制

數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)是數(shù)據(jù)庫(kù)系統(tǒng)的基礎(chǔ)。DBMS的研制包括研制DBMS本身及以DBMS為核心的一組相互聯(lián)系的軟件系統(tǒng)。研制的目標(biāo)是擴(kuò)大功能、提高性能和提高用戶的生產(chǎn)率。

2.數(shù)據(jù)庫(kù)設(shè)計(jì)

數(shù)據(jù)庫(kù)設(shè)計(jì)的主要任務(wù)是在DBMS的支持下,按照應(yīng)用的要求,為某一部門或組織設(shè)計(jì)一個(gè)結(jié)構(gòu)合理、使用方便、效率較高的數(shù)據(jù)庫(kù)及其應(yīng)用系統(tǒng)。其中主要的研究方向包括數(shù)據(jù)庫(kù)設(shè)計(jì)方法、設(shè)計(jì)工具和設(shè)計(jì)理論的研究,數(shù)據(jù)模型和數(shù)據(jù)建模的研究,計(jì)算機(jī)輔助數(shù)據(jù)庫(kù)設(shè)計(jì)方法及其軟件系統(tǒng)的研究,數(shù)據(jù)庫(kù)設(shè)計(jì)規(guī)范和標(biāo)準(zhǔn)的研究等。

3.數(shù)據(jù)庫(kù)理論

數(shù)據(jù)庫(kù)理論的研究主要集中于關(guān)系的規(guī)范化理論、關(guān)系數(shù)據(jù)理論等。近年來(lái),隨著人工智能與數(shù)據(jù)庫(kù)理論的結(jié)合及并行計(jì)算機(jī)的發(fā)展,數(shù)據(jù)庫(kù)邏輯演繹和知識(shí)推理、并行算法等理論研究,以及演繹數(shù)據(jù)庫(kù)系統(tǒng)、知識(shí)庫(kù)系統(tǒng)和數(shù)據(jù)倉(cāng)庫(kù)的研制都已成為新的研究方向。

3.數(shù)據(jù)庫(kù)的優(yōu)點(diǎn)[2]

與數(shù)據(jù)文件管理方式相比較,數(shù)據(jù)庫(kù)管理有許多優(yōu)越性。這些優(yōu)越性來(lái)自數(shù)據(jù)庫(kù)特有的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)存儲(chǔ)方式。歸納起來(lái),數(shù)據(jù)庫(kù)有如下優(yōu)點(diǎn)。

(1)查詢迅速、準(zhǔn)確,且有多種表達(dá)與傳輸方式。以一個(gè)大型倉(cāng)庫(kù)管理為例:用手工操作,如要查找“某地區(qū)生產(chǎn)的商品的名稱、規(guī)格、數(shù)量”,就可能要先翻閱賬本,弄清分類目錄和分類形式,然后按地區(qū)或商品分類、商品名稱找到其他附帶的屬性,再抄寫下來(lái)。如果要查找的內(nèi)容較多,則查找與抄寫既費(fèi)時(shí)又費(fèi)力。數(shù)據(jù)庫(kù)系統(tǒng)能根據(jù)給定的條件自動(dòng)地按一定途徑以毫秒級(jí)速度進(jìn)行掃描查找,可以在瞬間將符合要求的數(shù)據(jù)一一用表格或其他方式顯示出來(lái),還可以自動(dòng)地打印出來(lái)或通過網(wǎng)絡(luò)傳輸?shù)街付ǖ刂?,而且不?huì)出現(xiàn)錯(cuò)誤。

(2)數(shù)據(jù)結(jié)構(gòu)化且統(tǒng)一管理。在數(shù)據(jù)庫(kù)中,數(shù)據(jù)按邏輯結(jié)構(gòu)組織起來(lái),而按物理結(jié)構(gòu)存放在磁介質(zhì)中,并且由數(shù)據(jù)庫(kù)管理系統(tǒng)統(tǒng)一管理,既考慮了數(shù)據(jù)本身的特點(diǎn),也考慮了數(shù)據(jù)之間以及文件之間的聯(lián)系,數(shù)據(jù)的查詢、檢索和處理很方便。在傳統(tǒng)的文件系統(tǒng)中,盡管記錄內(nèi)部存在某種結(jié)構(gòu),但記錄之間沒有聯(lián)系,數(shù)據(jù)的查詢、檢索和處理十分煩瑣、困難。實(shí)現(xiàn)數(shù)據(jù)的整體結(jié)構(gòu)化管理,是數(shù)據(jù)庫(kù)的主要特征之一,也是數(shù)據(jù)庫(kù)系統(tǒng)與文件系統(tǒng)的本質(zhì)區(qū)別。

(3)數(shù)據(jù)冗余度小。在文件系統(tǒng)中,為了滿足一個(gè)應(yīng)用程序?qū)?shù)據(jù)的需要,常常在不同地方重復(fù)存放同一個(gè)或同一組數(shù)據(jù)。這樣一來(lái),如果一個(gè)多處存放的數(shù)據(jù)出現(xiàn)錯(cuò)誤,就必須同時(shí)修改幾個(gè)地方,否則將造成數(shù)據(jù)之間的不一致性。在數(shù)據(jù)庫(kù)系統(tǒng)中,數(shù)據(jù)不僅可以面向某個(gè)局部應(yīng)用而且可以面向整體應(yīng)用,從而大大減少數(shù)據(jù)冗余,節(jié)約了存儲(chǔ)空間,有效地避免了數(shù)據(jù)之間的不一致性。

(4)具有較高的數(shù)據(jù)獨(dú)立性。數(shù)據(jù)獨(dú)立性是指用戶應(yīng)用程序與存儲(chǔ)在數(shù)據(jù)庫(kù)中數(shù)據(jù)的相互獨(dú)立性。當(dāng)人們利用應(yīng)用程序調(diào)用數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)處理時(shí),只涉及數(shù)據(jù)的邏輯結(jié)構(gòu),而不涉及其存儲(chǔ)方式和物理結(jié)構(gòu)。而當(dāng)數(shù)據(jù)的物理存儲(chǔ)方式和結(jié)構(gòu)改變時(shí),數(shù)據(jù)庫(kù)管理系統(tǒng)將自動(dòng)處理這種改變,而應(yīng)用程序不必改變。近期甚至發(fā)展到數(shù)據(jù)庫(kù)的邏輯結(jié)構(gòu)改變了,用戶程序也可以不變。用戶程序不隨數(shù)據(jù)邏輯結(jié)構(gòu)改變而改變的特性,可稱為數(shù)據(jù)的“邏輯獨(dú)立性”。數(shù)據(jù)獨(dú)立性(物理的和邏輯的)是數(shù)據(jù)庫(kù)的重要特征和優(yōu)點(diǎn),它有利于在數(shù)據(jù)庫(kù)結(jié)構(gòu)修改時(shí)保持應(yīng)用程序的穩(wěn)定性,可以大大減少應(yīng)用程序員的軟件開發(fā)工作量。

(5)數(shù)據(jù)的共享性好。存放于數(shù)據(jù)庫(kù)中的數(shù)據(jù)的共享性包括系統(tǒng)內(nèi)部共享性和外部共享性兩種,這是數(shù)據(jù)庫(kù)管理方式區(qū)別于手工管理和文件管理方式的最本質(zhì)的特征和優(yōu)點(diǎn)。

系統(tǒng)內(nèi)部的共享性是指同一個(gè)(組)數(shù)據(jù)在一次處理中可以多次被調(diào)用的性能,而系統(tǒng)外部的共享性是指同一個(gè)(組)數(shù)據(jù)可以同時(shí)供多個(gè)用戶調(diào)用。這兩種共享性的原理是一致的,它使得多種作業(yè)、多種語(yǔ)言、多種用戶可以相互覆蓋地使用數(shù)據(jù)集合。

內(nèi)部共享性有效地降低了數(shù)據(jù)的冗余度,系統(tǒng)很容易進(jìn)行維護(hù)和擴(kuò)充,而且能夠使應(yīng)用程序的編寫更加方便。系統(tǒng)外部共享性能夠促進(jìn)并實(shí)現(xiàn)信息社會(huì)化服務(wù),可以充分發(fā)揮信息的價(jià)值。舉一個(gè)簡(jiǎn)單的事例,在沒有使用數(shù)據(jù)庫(kù)技術(shù)時(shí),火車票和飛機(jī)票發(fā)售的數(shù)據(jù)很難共享,常常出現(xiàn)有的售票處某線路車票或機(jī)票已售完,而另一售票處還有很多同一線路的車票或機(jī)票無(wú)人購(gòu)買的情況。為了避免上述現(xiàn)象的出現(xiàn),火車客運(yùn)站和航空公司往往采取讓不同售票處出售不同路線車票和機(jī)票的做法,結(jié)果給乘客帶來(lái)許多不便。如今采用數(shù)據(jù)庫(kù)來(lái)管理車票和機(jī)票發(fā)售工作,各個(gè)售票處可以互通有無(wú),乘客不但可以在一個(gè)城市的任何售票處方便地查詢并購(gòu)買當(dāng)?shù)爻霭l(fā)的某路線車票和機(jī)票,而且隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,人們甚至可以在全國(guó)任一城市查詢并購(gòu)買異地出發(fā)的任一路線車票和機(jī)票。

4.數(shù)據(jù)庫(kù)的組成[2]

一個(gè)數(shù)據(jù)庫(kù)有4個(gè)主要成分:數(shù)據(jù)(data)、關(guān)系(relationship)、約束(constraint)和模式(schema)(見下圖)。數(shù)據(jù)是所存儲(chǔ)的邏輯實(shí)體在計(jì)算機(jī)中的二進(jìn)制表示;關(guān)系表示數(shù)據(jù)項(xiàng)之間的某種對(duì)應(yīng);約束是定義正確數(shù)據(jù)狀態(tài)的語(yǔ)言;模式描述數(shù)據(jù)庫(kù)中數(shù)據(jù)的組織和聯(lián)系。

Image:數(shù)據(jù)庫(kù)的組成.jpg

評(píng)論  |   0條評(píng)論