元數(shù)據(jù)
目錄
1.什么是元數(shù)據(jù)
元數(shù)據(jù)是關(guān)于數(shù)據(jù)的組織、數(shù)據(jù)域及其關(guān)系的信息,簡言之,元數(shù)據(jù)就是關(guān)于數(shù)據(jù)的數(shù)據(jù)。
2.元數(shù)據(jù)的特點(diǎn)[1]
①元數(shù)據(jù)是關(guān)于數(shù)據(jù)的結(jié)構(gòu)化的數(shù)據(jù),它不一定是數(shù)字形式的,可來自不同的資源。
②元數(shù)據(jù)是與對象相關(guān)的數(shù)據(jù),此數(shù)據(jù)使其潛在的用戶不必先具備對這些對象的存在和特征的完整認(rèn)識(shí)。
③元數(shù)據(jù)是對信息包裹(Information Package)的編碼的描述。
④元數(shù)據(jù)包含用于描述信息對象的內(nèi)容和位置的數(shù)據(jù)元素集,促進(jìn)了網(wǎng)絡(luò)環(huán)境中信息對象的發(fā)現(xiàn)和檢索。
⑤元數(shù)據(jù)不僅對信息對象進(jìn)行描述,還能夠描述資源的使用環(huán)境、管理、加工、保存和使用等方面的情況。
⑥在信息對象或系統(tǒng)的生命周期中自然增加元數(shù)據(jù)。
⑦元數(shù)據(jù)常規(guī)定義中的“數(shù)據(jù)”是表示事務(wù)性質(zhì)的符號,是進(jìn)行各種統(tǒng)計(jì)、計(jì)算、科學(xué)研究、技術(shù)設(shè)計(jì)所依據(jù)的數(shù)值,或是說數(shù)字化、公式化、代碼化、圖表化的信息。
3.元數(shù)據(jù)的類型[1]
根據(jù)功能可將元數(shù)據(jù)劃分為管理型元數(shù)據(jù)、描述型元數(shù)據(jù)、保存型元數(shù)據(jù)、技術(shù)型元數(shù)據(jù)、使用型元數(shù)據(jù)。根據(jù)結(jié)構(gòu)和語境可將元數(shù)據(jù)劃分為三組:第一組為全文索引;第二組為簡單結(jié)構(gòu)化的普通格式,如DC、RFCl807、Template等;第三組為結(jié)構(gòu)復(fù)雜的特殊領(lǐng)域內(nèi)的格式,如FGDC、GILS、TEI、EAD等。
根據(jù)元數(shù)據(jù)的應(yīng)用范圍,可分為通用性元數(shù)據(jù)、專業(yè)性元數(shù)據(jù)、Web元數(shù)據(jù)、多媒體元數(shù)據(jù)。
4.元數(shù)據(jù)的結(jié)構(gòu)[1]
①內(nèi)容結(jié)構(gòu)。包括描述性元素、技術(shù)性元素、管理性元素、復(fù)用性元素。
②句法結(jié)構(gòu)。包括元素的分區(qū)分層分段組織結(jié)構(gòu)、元素結(jié)構(gòu)描述方法、DTD描述語言、元數(shù)據(jù)復(fù)用方式、與被描述對象的捆綁方式。
③語義結(jié)構(gòu)。包括元素內(nèi)容編碼規(guī)則定義、元素定義、元素語義概念關(guān)系、元數(shù)據(jù)版本管理。
5.元數(shù)據(jù)的作用[2]
元數(shù)據(jù)是網(wǎng)絡(luò)信息資源描述的重要工具,可以用于網(wǎng)絡(luò)信息資源管理的各個(gè)方面,包括信息資源的建立、發(fā)布、轉(zhuǎn)換、使用、共享等。元數(shù)據(jù)在網(wǎng)絡(luò)信息資源組織方面的作用可以概括為五個(gè)方面:描述、定位、搜尋、評估和選擇。
(1)描述作用:根據(jù)元數(shù)據(jù)的定義,它最基本的功能就在于對信息對象的內(nèi)容和位置進(jìn)行描述,從而為信息對象的存取與利用奠定必要的基礎(chǔ)。
(2)定位作用:由于網(wǎng)絡(luò)信息資源沒有具體的實(shí)體存在,因此,明確它的定位至關(guān)重要。元數(shù)據(jù)包含有關(guān)網(wǎng)絡(luò)信息資源位置方面的信息,因而由此便可確定資源的位置之所在,促進(jìn)了網(wǎng)絡(luò)環(huán)境中信息對象的發(fā)現(xiàn)和檢索。此外,在信息對象的元數(shù)據(jù)確定以后,信息對象在數(shù)據(jù)庫或其他集合體中的位置也就確定了,這是定位的另一層含義。
(3)搜尋作用:元數(shù)據(jù)提供搜尋的基礎(chǔ),在著錄的過程中,將信息對象中的重要信息抽出并加以組織,賦予語意,并建立關(guān)系,使檢索結(jié)果更加準(zhǔn)確,從而有利于用戶識(shí)別資源的價(jià)值,發(fā)現(xiàn)其真正需要的資源。
(4)評估作用:元數(shù)據(jù)提供有關(guān)信息對象的名稱、內(nèi)容、年代、格式、制作者等基本屬性,使用戶在無需瀏覽信息對象本身的情況下,就能夠?qū)π畔ο缶邆浠玖私夂驼J(rèn)識(shí),參照有關(guān)標(biāo)準(zhǔn)即可對其價(jià)值進(jìn)行必要的評估,作為存取利用的參考。
(5)選擇作用:根據(jù)元數(shù)據(jù)所提供的描述信息,參照相應(yīng)的評估標(biāo)準(zhǔn),結(jié)合使用環(huán)境,用戶便能夠做出對信息對象取舍的決定,選擇適合用戶使用的資源。
6.元數(shù)據(jù)的各種解決方案[1]
1.網(wǎng)絡(luò)資源:Dublin Core、IAFA Template、CDF、Web CoIlections。
2.文獻(xiàn)資料:MARC(with 856 Field),Dublin Core。
3.人文科學(xué):TEI Header(Text encoding initiative Header)。
4.社會(huì)科學(xué)數(shù)據(jù)集:ICPSR SGML Codebook。
5.博物館與藝術(shù)作品:CIMI(Computer Interchange of Museum Information)、CDWA(Categories for the Description of Works of Art)、RLG REACH Element Set、VRA Core。
6.政府信息:GILS(Government Information Locator Service)。
7.地理空間信息:FGDC/CSDGM(Federal Geographic Data Committee/Content Standard for Digital Geospatial Metadata)。
8.數(shù)字圖像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core NISO/CLIR/RLG Technical Metadata for Images。
9.檔案庫與資源集合:EAD。
10.技術(shù)報(bào)告:RFC 1807、ibTeX、EELS、EEVL。
11.連續(xù)圖像:MPEG-7。