登錄

查全率

1.什么是查全率

查全率是指檢出的相關(guān)文獻(xiàn)量與檢索系統(tǒng)中相關(guān)文獻(xiàn)總量的比率,是衡量信息檢索系統(tǒng)檢出相關(guān)文獻(xiàn)能力的尺度。

2.查全率的計算公式[1]

查全率=

檢索出的相關(guān)信息量

× 100%

系統(tǒng)中的相關(guān)信息總量

3.查全率的局限性[1]

查全率的局限性主要表現(xiàn)在:它是檢索出的相關(guān)信息量與存儲在檢索系統(tǒng)中的全部相關(guān)信息量之比,但系統(tǒng)中相關(guān)信息量究竟有多少一般是不確知的,只能估計;另外,查全率或多或少具有“假設(shè)”的局限性,這種“假設(shè)”是指檢索出的相關(guān)信息對用戶具有同等價值,但實(shí)際并非如此,對于用戶來說,信息的相關(guān)程度在某種意義上比它的數(shù)量重要得多。

為了保證查全率,在選取檢索詞和制定策略時應(yīng)從多角度考慮,將與檢索相關(guān)的同義詞、反義詞、上下位詞和易錯形式等4種類型的用詞進(jìn)行相關(guān)檢索。另外,同義詞包括了學(xué)名與俗名、全稱與簡稱、新稱與舊稱、外文形式及其簡稱、不同的譯名等,還有化學(xué)物質(zhì)的名稱和分子式如“二氧化硫”和“SO2”、不同地區(qū)、國家的俗稱如“民樂”(中國大陸)和“國樂”(中國臺灣)及“華樂”(新加坡)、古代名人字號等。反義詞可以從相反的角度反映同一個問題,用來作相關(guān)檢索也可提高查全率。上下位詞有助于分析信息檢索中學(xué)科知識的網(wǎng)絡(luò)分布,準(zhǔn)確把握主題用詞,能有效控制檢索的深度和廣度。而檢索詞的易錯形式則是主要針對出版、輸入時的誤差采用的檢索辦法,如“高梁”和“高梁”、“豆豉”和“豆鼓”、“針灸”和“針炙”等,如果在檢索時將有關(guān)的全稱、簡稱、舊稱、英語全稱、英語縮寫以及簡稱作為檢索用詞,則能有效提高檢索的查全率。

4.影響查全率的因素[2]

影響查全率的因素從文獻(xiàn)存儲來看,主要有:文獻(xiàn)庫收錄文獻(xiàn)不全;索引詞匯缺乏控制和專指性;詞表結(jié)構(gòu)不完整;詞間關(guān)系模糊或不正確;標(biāo)引不詳;標(biāo)引前后不一致;標(biāo)引人員遺漏了原文的重要概念或用詞不當(dāng)?shù)取4送?,從情報檢索來看,主要有:檢索策略過于簡單;選詞和進(jìn)行邏輯組配不當(dāng);檢索途徑和方法太少;檢索人員業(yè)務(wù)不熟練和缺乏耐心;檢索系統(tǒng)不具備截詞功能和反饋功能,檢索時不能全面地描述檢索要求等。

5.提高查全率的具體方法[3]

提高查全率首先應(yīng)正確選詞。選詞就是將主題概念轉(zhuǎn)變成檢索語言,選詞的廣度和專指度對主題概念的表達(dá)起著關(guān)鍵作用。提高查全率的指導(dǎo)思想是:選詞應(yīng)廣泛,即主題詞的選取范圍要廣一些,泛指性要強(qiáng)一些;邏輯算符應(yīng)選擇具有擴(kuò)檢意義的“邏輯或”。

1.上、下位擴(kuò)檢法

為了提高文獻(xiàn)檢索的查全率,除選擇恰當(dāng)?shù)闹黝}詞外,還應(yīng)該選擇內(nèi)容范圍更廣的上位詞及更窄的下位詞參與檢索,以擴(kuò)大檢索范圍。例如,檢索“液體火箭發(fā)動機(jī)”可用這樣的檢索式:液體火箭發(fā)動機(jī)OR氫氧發(fā)動機(jī)OR肼發(fā)動機(jī)OR火箭發(fā)動機(jī)。

2.同義詞、近義詞擴(kuò)檢法

許多全文數(shù)據(jù)庫都支持關(guān)鍵詞檢索。利用關(guān)鍵詞檢索,用戶不必掌握復(fù)雜的敘詞知識,這使檢索變得簡單而直接。由于關(guān)鍵詞未經(jīng)規(guī)范處理,它們之間不顯示詞的等級關(guān)系和相關(guān)關(guān)系,這都增加了查全文獻(xiàn)的難度。因此,為了全面地收集文獻(xiàn),在進(jìn)行某一專題檢索時不僅要確定較規(guī)范的主題詞,還要考慮與該主題詞相關(guān)的同義詞或近義詞,即學(xué)名與俗稱之間、同一產(chǎn)品的正式命名與俗名之間的相關(guān)關(guān)系等。反映同一概念的檢索詞越多,則越能保證查全率,如“乙醇”俗名“酒精”,“維生素C”俗稱“維他命C”或“抗壞血酸”,“番茄”俗稱“西紅柿”,“馬鈴薯”俗稱“土豆”,“敵克松”又稱“地可松”等。這類意思一樣但表達(dá)方式不同的詞,在檢索中應(yīng)加以重視。如果不考慮這種情況,在檢索中就會漏掉一些文獻(xiàn),從而影響查全率。

3.增加“邏輯或”組配

文獻(xiàn)檢索中除正確選擇主題詞外,恰當(dāng)?shù)乇磉_(dá)主題詞之間的邏輯關(guān)系也是提高查全率的重要方法。在邏輯組配過程中,必須正確地選用邏輯算符來表達(dá)檢索項之間的邏輯關(guān)系,以真實(shí)、確切地反映檢索要求。如果邏輯算符選得不對或不恰當(dāng),將會產(chǎn)生漏檢或誤檢,直接影響檢索質(zhì)量。前面已提到,用“邏輯或”組配可以擴(kuò)檢,而“邏輯與”組配可以縮檢,因此,提高檢索的查全率必須增加OR組配,減少AND組配。方法之一是選全同義詞,并以O(shè)R方式與原詞連接后加入檢索式。例如,檢索“乙醇的生產(chǎn)”方面的文獻(xiàn),可制訂檢索式:乙醇OR酒精AND生產(chǎn)。

評論  |   0條評論