主題檢索語言
1.什么是主題法檢索語言
主題法檢索語言是另一種從內(nèi)容角度標(biāo)引和檢索信息資源的方法。它不像分類法以學(xué)科體系為中心,而是利用詞語來表達(dá)信息資源中論述的主題概念。用來表達(dá)信息內(nèi)容的詞語稱為主題詞。主題詞不同于自然語言,它是將自然語言中經(jīng)過人工規(guī)范后的詞匯,即經(jīng)過詞匯控制的詞語。所謂主題法,就是以自然語言中的詞語或規(guī)范化的詞語作為揭示文獻(xiàn)主題的標(biāo)識(shí),并以此標(biāo)識(shí)、編排、組織和查找文獻(xiàn)的排檢方法。主題指文獻(xiàn)所具體論述的對象和研究的問題。它以語詞作為檢索標(biāo)識(shí),按字順排列,直觀性強(qiáng),也是二種普遍使用的信息組織方法。該方法提供了一種直接面向具體對象、事實(shí)或概念的信息組織方法和信息檢索途徑。
2.主題法檢索語言的類型[1]
1)標(biāo)題法:也稱標(biāo)題詞法,是主題法系統(tǒng)中最早出現(xiàn)的一種,它是以標(biāo)題詞(規(guī)范的事物名稱、名詞術(shù)語)作為文獻(xiàn)主題內(nèi)容的標(biāo)識(shí)和檢索標(biāo)識(shí)。標(biāo)題法的主要特征是事先編表,標(biāo)題詞以固定的組合方式組織在主題表中,形成標(biāo)題,檢索按既定組配執(zhí)行。標(biāo)題表通常由一個(gè)主表和若干個(gè)輔助表組成?!睹绹鴩鴷?huì)圖書館標(biāo)題表》(LCSH)是當(dāng)今最著名的標(biāo)題表。標(biāo)題法比較直觀、容易掌握;查找速度快,但查全一門學(xué)科或具某一詹l生事物的文獻(xiàn)卻較為困難。
2)敘詞法:又稱為主題詞法,是將自然語言的語詞概念,經(jīng)過規(guī)范化和優(yōu)選處理,通過組配來標(biāo)識(shí)文獻(xiàn)主題的方法。敘詞具有概念性、描述性、組配性的特點(diǎn)。敘詞法綜合了多種信息檢索語言的原理和方法,采用靈活的概念組配,并在詞與詞之間建立參照系統(tǒng)。敘詞法適用于計(jì)算機(jī)和手工檢索系統(tǒng),是目前應(yīng)用較廣的一種主題檢索語言。CA、EI等著名檢索工具都采用了敘詞法進(jìn)行編排。我國目前使用最廣的《中國分類主題詞表》(前身是《漢語主題詞表》)就是屬于敘詞法,有電子版和印刷版兩種形式?!吨袊诸愔黝}詞表》是分類主題一體化的詞表,與《中圖法》相互對應(yīng),這對文獻(xiàn)信息的組織和檢索十分方便。而且各個(gè)主題詞及其之間的關(guān)系是嚴(yán)格控制的,從而構(gòu)成一個(gè)嚴(yán)密的語義網(wǎng)絡(luò),為建立高效的文獻(xiàn)信息檢索系統(tǒng)提供了保證。
3)關(guān)鍵詞法:關(guān)鍵詞是指出現(xiàn)在文獻(xiàn)標(biāo)題、文摘、正文中,對表達(dá)文獻(xiàn)主題內(nèi)容具有實(shí)質(zhì)意義的語詞,對揭示和描述文獻(xiàn)主題內(nèi)容是重要的、關(guān)鍵性的語詞。使用關(guān)鍵詞對文獻(xiàn)信息進(jìn)行描述、建立主題檢索系統(tǒng)的方法稱關(guān)鍵詞法。由于關(guān)鍵詞能深入、直觀地揭示信息中所包含的知識(shí),而且符合人們的思維習(xí)慣,因此關(guān)鍵詞法在信息組織中得到了廣泛應(yīng)用。網(wǎng)上各種各樣的搜索引擎和數(shù)據(jù)庫大多采用了關(guān)鍵詞法組織信息資源,如網(wǎng)易、搜狐等搜索引擎,中國科技期刊數(shù)據(jù)庫等也使用了關(guān)鍵詞法來組織信息。由于關(guān)鍵詞法的詞語不規(guī)范,影響了文獻(xiàn)信息的查全率和查準(zhǔn)率。
4)自然語言法:自然語言法是不進(jìn)行標(biāo)引,直接利用計(jì)算機(jī)的功能,通過自然語言中的詞匯或詞組組配對文本形式的信息資源進(jìn)行匹配檢索的方法。這種方法又稱文本檢索或全文檢索。全文檢索可以是整個(gè)文本,包括文章、專利或整本書,也可以是標(biāo)題、文摘等。近年來,隨著電子文本的普及,全文檢索逐漸成為檢索的重要方法。
3.主題法檢索語言的特點(diǎn)
1.靈活性。主題法檢索語言打破了類目或者職能體系的限制,主要采用一些在檔案檢索中使用頻率較高的語義相關(guān)、概念等級(jí)相關(guān)和族系相關(guān)的名詞術(shù)語,或者概念明確、形式固定、專指性強(qiáng)的術(shù)語、專稱和詞組對檔案文獻(xiàn)的內(nèi)容進(jìn)行高度概括,從而達(dá)到標(biāo)引和檢索的目的。也就是說,主題法檢索語言是以語言為基礎(chǔ)的,語言表達(dá)的多樣性和靈活性,決定了主題法檢索語言在表達(dá)檔案文獻(xiàn)內(nèi)容方面的靈活性。
2.通俗性。由于主題法檢索語言是用自然語言來標(biāo)識(shí)的,不必象分類檢索語言那樣轉(zhuǎn)換成代碼,而且所選用的名詞術(shù)語、專稱、詞組等大多數(shù)都通俗易懂,對于部分從字面上不易理解的主題詞,在主題表中對其含義進(jìn)行了簡要注釋,因此即使是對于毫無檔案專業(yè)知識(shí)的人來說,也能十分順利地應(yīng)用主題法檢索語言來檢索出自己所需的檔案文獻(xiàn)信息。這對于實(shí)現(xiàn)檔案文獻(xiàn)信息綜合數(shù)據(jù)庫的資源共享,改進(jìn)檔案檢索系統(tǒng)與用戶的見面效果,更好地為用戶提供檔案信息服務(wù)具有十分重要的意義。
3.多元性。在應(yīng)用主題法檢索語言過程中,可以選用主題表中兩個(gè)或兩個(gè)以上的正式主題詞進(jìn)行組合搭配,在詞與詞之間建立起語義關(guān)系或邏輯關(guān)系,從而產(chǎn)生一個(gè)復(fù)合式的具有特定含義的新概念,用以表達(dá)檔案內(nèi)容中用單個(gè)主題詞難以表達(dá)的特殊主題。它不僅可以用數(shù)量有限的正式主題詞,在一定范圍內(nèi)擴(kuò)大檢索空間,提供變化多端、精細(xì)、準(zhǔn)確的檢索途徑,而且經(jīng)過詞素輪排后,所有獨(dú)立詞都可作為查詞入口,大大增加了檢索途徑,從而為多元檢索創(chuàng)造了條件。