主題檢索語(yǔ)言
1.什么是主題法檢索語(yǔ)言
主題法檢索語(yǔ)言是另一種從內(nèi)容角度標(biāo)引和檢索信息資源的方法。它不像分類(lèi)法以學(xué)科體系為中心,而是利用詞語(yǔ)來(lái)表達(dá)信息資源中論述的主題概念。用來(lái)表達(dá)信息內(nèi)容的詞語(yǔ)稱(chēng)為主題詞。主題詞不同于自然語(yǔ)言,它是將自然語(yǔ)言中經(jīng)過(guò)人工規(guī)范后的詞匯,即經(jīng)過(guò)詞匯控制的詞語(yǔ)。所謂主題法,就是以自然語(yǔ)言中的詞語(yǔ)或規(guī)范化的詞語(yǔ)作為揭示文獻(xiàn)主題的標(biāo)識(shí),并以此標(biāo)識(shí)、編排、組織和查找文獻(xiàn)的排檢方法。主題指文獻(xiàn)所具體論述的對(duì)象和研究的問(wèn)題。它以語(yǔ)詞作為檢索標(biāo)識(shí),按字順排列,直觀性強(qiáng),也是二種普遍使用的信息組織方法。該方法提供了一種直接面向具體對(duì)象、事實(shí)或概念的信息組織方法和信息檢索途徑。
2.主題法檢索語(yǔ)言的類(lèi)型[1]
1)標(biāo)題法:也稱(chēng)標(biāo)題詞法,是主題法系統(tǒng)中最早出現(xiàn)的一種,它是以標(biāo)題詞(規(guī)范的事物名稱(chēng)、名詞術(shù)語(yǔ))作為文獻(xiàn)主題內(nèi)容的標(biāo)識(shí)和檢索標(biāo)識(shí)。標(biāo)題法的主要特征是事先編表,標(biāo)題詞以固定的組合方式組織在主題表中,形成標(biāo)題,檢索按既定組配執(zhí)行。標(biāo)題表通常由一個(gè)主表和若干個(gè)輔助表組成?!睹绹?guó)國(guó)會(huì)圖書(shū)館標(biāo)題表》(LCSH)是當(dāng)今最著名的標(biāo)題表。標(biāo)題法比較直觀、容易掌握;查找速度快,但查全一門(mén)學(xué)科或具某一詹l生事物的文獻(xiàn)卻較為困難。
2)敘詞法:又稱(chēng)為主題詞法,是將自然語(yǔ)言的語(yǔ)詞概念,經(jīng)過(guò)規(guī)范化和優(yōu)選處理,通過(guò)組配來(lái)標(biāo)識(shí)文獻(xiàn)主題的方法。敘詞具有概念性、描述性、組配性的特點(diǎn)。敘詞法綜合了多種信息檢索語(yǔ)言的原理和方法,采用靈活的概念組配,并在詞與詞之間建立參照系統(tǒng)。敘詞法適用于計(jì)算機(jī)和手工檢索系統(tǒng),是目前應(yīng)用較廣的一種主題檢索語(yǔ)言。CA、EI等著名檢索工具都采用了敘詞法進(jìn)行編排。我國(guó)目前使用最廣的《中國(guó)分類(lèi)主題詞表》(前身是《漢語(yǔ)主題詞表》)就是屬于敘詞法,有電子版和印刷版兩種形式?!吨袊?guó)分類(lèi)主題詞表》是分類(lèi)主題一體化的詞表,與《中圖法》相互對(duì)應(yīng),這對(duì)文獻(xiàn)信息的組織和檢索十分方便。而且各個(gè)主題詞及其之間的關(guān)系是嚴(yán)格控制的,從而構(gòu)成一個(gè)嚴(yán)密的語(yǔ)義網(wǎng)絡(luò),為建立高效的文獻(xiàn)信息檢索系統(tǒng)提供了保證。
3)關(guān)鍵詞法:關(guān)鍵詞是指出現(xiàn)在文獻(xiàn)標(biāo)題、文摘、正文中,對(duì)表達(dá)文獻(xiàn)主題內(nèi)容具有實(shí)質(zhì)意義的語(yǔ)詞,對(duì)揭示和描述文獻(xiàn)主題內(nèi)容是重要的、關(guān)鍵性的語(yǔ)詞。使用關(guān)鍵詞對(duì)文獻(xiàn)信息進(jìn)行描述、建立主題檢索系統(tǒng)的方法稱(chēng)關(guān)鍵詞法。由于關(guān)鍵詞能深入、直觀地揭示信息中所包含的知識(shí),而且符合人們的思維習(xí)慣,因此關(guān)鍵詞法在信息組織中得到了廣泛應(yīng)用。網(wǎng)上各種各樣的搜索引擎和數(shù)據(jù)庫(kù)大多采用了關(guān)鍵詞法組織信息資源,如網(wǎng)易、搜狐等搜索引擎,中國(guó)科技期刊數(shù)據(jù)庫(kù)等也使用了關(guān)鍵詞法來(lái)組織信息。由于關(guān)鍵詞法的詞語(yǔ)不規(guī)范,影響了文獻(xiàn)信息的查全率和查準(zhǔn)率。
4)自然語(yǔ)言法:自然語(yǔ)言法是不進(jìn)行標(biāo)引,直接利用計(jì)算機(jī)的功能,通過(guò)自然語(yǔ)言中的詞匯或詞組組配對(duì)文本形式的信息資源進(jìn)行匹配檢索的方法。這種方法又稱(chēng)文本檢索或全文檢索。全文檢索可以是整個(gè)文本,包括文章、專(zhuān)利或整本書(shū),也可以是標(biāo)題、文摘等。近年來(lái),隨著電子文本的普及,全文檢索逐漸成為檢索的重要方法。
3.主題法檢索語(yǔ)言的特點(diǎn)
1.靈活性。主題法檢索語(yǔ)言打破了類(lèi)目或者職能體系的限制,主要采用一些在檔案檢索中使用頻率較高的語(yǔ)義相關(guān)、概念等級(jí)相關(guān)和族系相關(guān)的名詞術(shù)語(yǔ),或者概念明確、形式固定、專(zhuān)指性強(qiáng)的術(shù)語(yǔ)、專(zhuān)稱(chēng)和詞組對(duì)檔案文獻(xiàn)的內(nèi)容進(jìn)行高度概括,從而達(dá)到標(biāo)引和檢索的目的。也就是說(shuō),主題法檢索語(yǔ)言是以語(yǔ)言為基礎(chǔ)的,語(yǔ)言表達(dá)的多樣性和靈活性,決定了主題法檢索語(yǔ)言在表達(dá)檔案文獻(xiàn)內(nèi)容方面的靈活性。
2.通俗性。由于主題法檢索語(yǔ)言是用自然語(yǔ)言來(lái)標(biāo)識(shí)的,不必象分類(lèi)檢索語(yǔ)言那樣轉(zhuǎn)換成代碼,而且所選用的名詞術(shù)語(yǔ)、專(zhuān)稱(chēng)、詞組等大多數(shù)都通俗易懂,對(duì)于部分從字面上不易理解的主題詞,在主題表中對(duì)其含義進(jìn)行了簡(jiǎn)要注釋?zhuān)虼思词故菍?duì)于毫無(wú)檔案專(zhuān)業(yè)知識(shí)的人來(lái)說(shuō),也能十分順利地應(yīng)用主題法檢索語(yǔ)言來(lái)檢索出自己所需的檔案文獻(xiàn)信息。這對(duì)于實(shí)現(xiàn)檔案文獻(xiàn)信息綜合數(shù)據(jù)庫(kù)的資源共享,改進(jìn)檔案檢索系統(tǒng)與用戶(hù)的見(jiàn)面效果,更好地為用戶(hù)提供檔案信息服務(wù)具有十分重要的意義。
3.多元性。在應(yīng)用主題法檢索語(yǔ)言過(guò)程中,可以選用主題表中兩個(gè)或兩個(gè)以上的正式主題詞進(jìn)行組合搭配,在詞與詞之間建立起語(yǔ)義關(guān)系或邏輯關(guān)系,從而產(chǎn)生一個(gè)復(fù)合式的具有特定含義的新概念,用以表達(dá)檔案內(nèi)容中用單個(gè)主題詞難以表達(dá)的特殊主題。它不僅可以用數(shù)量有限的正式主題詞,在一定范圍內(nèi)擴(kuò)大檢索空間,提供變化多端、精細(xì)、準(zhǔn)確的檢索途徑,而且經(jīng)過(guò)詞素輪排后,所有獨(dú)立詞都可作為查詞入口,大大增加了檢索途徑,從而為多元檢索創(chuàng)造了條件。