登錄

主題檢索語言

百科 > 信息管理術(shù)語 > 主題檢索語言

1.什么是主題法檢索語言

主題法檢索語言是另一種從內(nèi)容角度標(biāo)引和檢索信息資源的方法。它不像分類法以學(xué)科體系為中心,而是利用詞語來表達(dá)信息資源中論述的主題概念。用來表達(dá)信息內(nèi)容的詞語稱為主題詞。主題詞不同于自然語言,它是將自然語言中經(jīng)過人工規(guī)范后的詞匯,即經(jīng)過詞匯控制的詞語。所謂主題法,就是以自然語言中的詞語或規(guī)范化的詞語作為揭示文獻主題的標(biāo)識,并以此標(biāo)識、編排、組織和查找文獻的排檢方法。主題指文獻所具體論述的對象和研究的問題。它以語詞作為檢索標(biāo)識,按字順排列,直觀性強,也是二種普遍使用的信息組織方法。該方法提供了一種直接面向具體對象、事實或概念的信息組織方法和信息檢索途徑。

2.主題法檢索語言的類型[1]

1)標(biāo)題法:也稱標(biāo)題詞法,是主題法系統(tǒng)中最早出現(xiàn)的一種,它是以標(biāo)題詞(規(guī)范的事物名稱、名詞術(shù)語)作為文獻主題內(nèi)容的標(biāo)識和檢索標(biāo)識。標(biāo)題法的主要特征是事先編表,標(biāo)題詞以固定的組合方式組織在主題表中,形成標(biāo)題,檢索按既定組配執(zhí)行。標(biāo)題表通常由一個主表和若干個輔助表組成?!睹绹鴩鴷D書館標(biāo)題表》(LCSH)是當(dāng)今最著名的標(biāo)題表。標(biāo)題法比較直觀、容易掌握;查找速度快,但查全一門學(xué)科或具某一詹l生事物的文獻卻較為困難。

2)敘詞法:又稱為主題詞法,是將自然語言的語詞概念,經(jīng)過規(guī)范化和優(yōu)選處理,通過組配來標(biāo)識文獻主題的方法。敘詞具有概念性、描述性、組配性的特點。敘詞法綜合了多種信息檢索語言的原理和方法,采用靈活的概念組配,并在詞與詞之間建立參照系統(tǒng)。敘詞法適用于計算機和手工檢索系統(tǒng),是目前應(yīng)用較廣的一種主題檢索語言。CA、EI等著名檢索工具都采用了敘詞法進行編排。我國目前使用最廣的《中國分類主題詞表》(前身是《漢語主題詞表》)就是屬于敘詞法,有電子版和印刷版兩種形式?!吨袊诸愔黝}詞表》是分類主題一體化的詞表,與《中圖法》相互對應(yīng),這對文獻信息的組織和檢索十分方便。而且各個主題詞及其之間的關(guān)系是嚴(yán)格控制的,從而構(gòu)成一個嚴(yán)密的語義網(wǎng)絡(luò),為建立高效的文獻信息檢索系統(tǒng)提供了保證。

3)關(guān)鍵詞法:關(guān)鍵詞是指出現(xiàn)在文獻標(biāo)題、文摘、正文中,對表達(dá)文獻主題內(nèi)容具有實質(zhì)意義的語詞,對揭示和描述文獻主題內(nèi)容是重要的、關(guān)鍵性的語詞。使用關(guān)鍵詞對文獻信息進行描述、建立主題檢索系統(tǒng)的方法稱關(guān)鍵詞法。由于關(guān)鍵詞能深入、直觀地揭示信息中所包含的知識,而且符合人們的思維習(xí)慣,因此關(guān)鍵詞法在信息組織中得到了廣泛應(yīng)用。網(wǎng)上各種各樣的搜索引擎和數(shù)據(jù)庫大多采用了關(guān)鍵詞法組織信息資源,如網(wǎng)易、搜狐等搜索引擎,中國科技期刊數(shù)據(jù)庫等也使用了關(guān)鍵詞法來組織信息。由于關(guān)鍵詞法的詞語不規(guī)范,影響了文獻信息的查全率查準(zhǔn)率。

4)自然語言法:自然語言法是不進行標(biāo)引,直接利用計算機的功能,通過自然語言中的詞匯或詞組組配對文本形式的信息資源進行匹配檢索的方法。這種方法又稱文本檢索或全文檢索。全文檢索可以是整個文本,包括文章、專利或整本書,也可以是標(biāo)題、文摘等。近年來,隨著電子文本的普及,全文檢索逐漸成為檢索的重要方法。

3.主題法檢索語言的特點

1.靈活性。主題法檢索語言打破了類目或者職能體系的限制,主要采用一些在檔案檢索中使用頻率較高的語義相關(guān)、概念等級相關(guān)和族系相關(guān)的名詞術(shù)語,或者概念明確、形式固定、專指性強的術(shù)語、專稱和詞組對檔案文獻的內(nèi)容進行高度概括,從而達(dá)到標(biāo)引和檢索的目的。也就是說,主題法檢索語言是以語言為基礎(chǔ)的,語言表達(dá)的多樣性和靈活性,決定了主題法檢索語言在表達(dá)檔案文獻內(nèi)容方面的靈活性。

2.通俗性。由于主題法檢索語言是用自然語言來標(biāo)識的,不必象分類檢索語言那樣轉(zhuǎn)換成代碼,而且所選用的名詞術(shù)語、專稱、詞組等大多數(shù)都通俗易懂,對于部分從字面上不易理解的主題詞,在主題表中對其含義進行了簡要注釋,因此即使是對于毫無檔案專業(yè)知識的人來說,也能十分順利地應(yīng)用主題法檢索語言來檢索出自己所需的檔案文獻信息。這對于實現(xiàn)檔案文獻信息綜合數(shù)據(jù)庫的資源共享,改進檔案檢索系統(tǒng)與用戶的見面效果,更好地為用戶提供檔案信息服務(wù)具有十分重要的意義。

3.多元性。在應(yīng)用主題法檢索語言過程中,可以選用主題表中兩個或兩個以上的正式主題詞進行組合搭配,在詞與詞之間建立起語義關(guān)系或邏輯關(guān)系,從而產(chǎn)生一個復(fù)合式的具有特定含義的新概念,用以表達(dá)檔案內(nèi)容中用單個主題詞難以表達(dá)的特殊主題。它不僅可以用數(shù)量有限的正式主題詞,在一定范圍內(nèi)擴大檢索空間,提供變化多端、精細(xì)、準(zhǔn)確的檢索途徑,而且經(jīng)過詞素輪排后,所有獨立詞都可作為查詞入口,大大增加了檢索途徑,從而為多元檢索創(chuàng)造了條件。

評論  |   0條評論