信息檢索語言
1.什么是信息檢索語言
信息檢索語言是信息組織與信息檢索時所用的語言,也稱文獻(xiàn)檢索語言、情報語言等。信息資源在存儲過程中,其內(nèi)容特征(分類、主題)和外部特征(如書名、刊名、題名、著者等)按照一定的語言來加以表達(dá),檢索文獻(xiàn)信息的提問也按照一定的語言來表達(dá),為了使檢索過程快速、準(zhǔn)確,檢索用戶與檢索系統(tǒng)需要統(tǒng)一的標(biāo)識系統(tǒng),這種在文獻(xiàn)信息的存儲與檢索過程中,共同使用、共同理解的統(tǒng)一標(biāo)識就是檢索語言。信息檢索語言主要有兩大類:分類檢索語言和主題檢索語言。
2.信息檢索語言的功能[1]
信息檢索語言是為查找信息服務(wù)的,因此,它必須具備以下的功能。
1.信息檢索語言應(yīng)可表示文獻(xiàn)內(nèi)容、數(shù)據(jù)或其他信息形式。為了滿足不同信息用戶的需要,信息檢索語言應(yīng)能根據(jù)不同的信息需求,表達(dá)不同的類型。例如,檢索某種器材的性能時,信息檢索語言應(yīng)能表達(dá)某些數(shù)據(jù)指標(biāo);而在檢索某種物質(zhì)結(jié)構(gòu)時,又能表達(dá)物質(zhì)名稱和物質(zhì)結(jié)構(gòu)方式。
2.有專用概念表示用戶的信息提問。信息檢索不單純是字面上的組合,而是一種概念上的匹配。例如,計(jì)算機(jī)繪圖,這里有兩個名詞,既可拆又可合。拆開后,依據(jù)“計(jì)算機(jī)”可查出“計(jì)算機(jī)解題”、“計(jì)算機(jī)控制”、“計(jì)算機(jī)維修”、“計(jì)算機(jī)繪圖”等信息;但“繪圖”卻涉及到美術(shù)繪圖、工程繪圖、計(jì)算機(jī)繪圖等,檢索不集中。在信息檢索語言中,概念組配“計(jì)算機(jī)繪圖”只表示一種概念,這樣專指性強(qiáng),命中率高。
3.能指示計(jì)算機(jī)執(zhí)行查詢與檢索。檢索者用語言項(xiàng)概念表達(dá)了信息提問后,要根據(jù)檢索系統(tǒng)的功能編寫成檢索策略,使檢索系統(tǒng)能順利、快速地查到信息提問所需要的信息。
3.信息檢索語言的類型[2]
區(qū)分依據(jù) | 類型 | 概念 | |
---|---|---|---|
按結(jié)構(gòu)原理 | 分類語言 | 等級制體 系分類法 | 用分類號表達(dá)各種概念并將其按學(xué)科性質(zhì)進(jìn)行分類和系統(tǒng)排列 |
組配分類法 | |||
按專業(yè)范圍 | 綜合性檢索語言 | 在一定范圍內(nèi)或國際范圍內(nèi)通用的檢索語言,如各國圖書分類法、國際十進(jìn)制分類法等 | |
專業(yè)性檢索語言 | 適用于某一專業(yè)領(lǐng)域的檢索語言,如各國專利分類法、標(biāo)準(zhǔn)分類法等 | ||
按標(biāo)識的組 合使用方法 | 先組式檢索語言 | 文獻(xiàn)等級制標(biāo)識在編表時就已固定組配,檢索時不可以改變的語言,如體系分類法、主題法 | |
后組式檢索語言 | 文獻(xiàn)標(biāo)識在檢索時可以根據(jù)需要自由組配的語言,如組配分類法、單元詞或敘詞索引等 | ||
按描述語言 的選詞特征 | 單元詞 | 代表文獻(xiàn)實(shí)質(zhì)意義、可以獨(dú)立存在的最小概念單元 | |
敘詞 | 經(jīng)規(guī)范化的可以獨(dú)立表達(dá)主題概念的詞語 | ||
關(guān)鍵詞 | 直接使用的基本上不加規(guī)范的自然詞語 | ||
主題詞 | 代表文獻(xiàn)實(shí)質(zhì)意義經(jīng)規(guī)范化的詞語 | ||
代碼 | 表示事物某一方面特征的符號標(biāo)識,如化合物分子式、環(huán)狀化合物標(biāo)識等 | ||
引證 | 一種表示科學(xué)論文之間相互引用關(guān)系的語言 | ||
按描述文獻(xiàn) 的特征 | 外表特征標(biāo)識 | 文獻(xiàn)上顯而易見的特征標(biāo)識,如作者姓名、文獻(xiàn)篇名、文獻(xiàn)代號、機(jī)構(gòu)名、刊物來源等 | |
內(nèi)容特征標(biāo)識 | 表示文獻(xiàn)主題實(shí)質(zhì)意義的特征標(biāo)識,如分類語言、主題詞、單元詞、敘詞、關(guān)鍵詞、自然語言等 |
4.信息檢索語言的作用[2]
檢索語言可以是一系列概括文獻(xiàn)信息內(nèi)容的概念及其相互關(guān)系的標(biāo)識系統(tǒng)(分類號碼);也可以是自然語言中選擇出來并加以規(guī)范化的一套詞匯(主題詞表或敘詞表)。它的功能主要是:簡單明了而又比較專指地描述文獻(xiàn)的主題概念;容易將概念進(jìn)行系統(tǒng)排列;檢索時便于將標(biāo)引用語和檢索用語進(jìn)行相符性比較等。為此,檢索語言必須排除一詞多義、多詞一義和詞義含糊的現(xiàn)象,并且還能顯示出概念間的各種相互關(guān)系,這也是檢索語言規(guī)范化的主要內(nèi)容。
信息檢索語言的職能主要包括以下三個方面。
- (1)信息檢索語言可以表示文獻(xiàn)內(nèi)容、數(shù)據(jù)或其他信息形式
為了滿足不同信息用戶的需要,信息檢索語言能夠根據(jù)不同的信息需求,表達(dá)不同的類型。
- (2)有專用概念表示用戶的信息提問
信息檢索不單純是字面上的組合,而是一種概念上的匹配。
- (3)能夠指示計(jì)算機(jī)執(zhí)行查詢與檢索檢索者用語言項(xiàng)概念表達(dá)了信息提問后,要根據(jù)檢索系統(tǒng)的功能編寫成檢索
策略,使檢索系統(tǒng)能順利、快速地查到信息提問所需要的信息。