登錄

檢索效果

1.什么是檢索效果

檢索效果是指檢索系統(tǒng)檢索的有效程度,它反映了檢索系統(tǒng)的能力,主要包括技術(shù)效果和經(jīng)濟(jì)效果兩個方面。評價檢索效果的目的是為了準(zhǔn)確地掌握系統(tǒng)的各種性能和水平,找出影響檢索效果的各種因素,以便有的放矢,改進(jìn)系統(tǒng)的性能,提高系統(tǒng)服務(wù)質(zhì)量,更好地滿足用戶信息檢索的需求。

2.檢索效果的評價指標(biāo)[1]

(1)查全率(Recall ratio),用R表示。查全率就是系統(tǒng)在進(jìn)行某一檢索時,被檢出的相關(guān)文獻(xiàn)量與系統(tǒng)文檔中實有的相關(guān)文獻(xiàn)量的比率。

(2)查準(zhǔn)率(Precision ratio),用P表示。查準(zhǔn)率是指檢出的相關(guān)文獻(xiàn)量與檢出文獻(xiàn)的總量的比率,是衡量信息檢索系統(tǒng)精確度的尺度。

(3)漏檢率(Omission ratio),用O表示。漏檢率是漏檢的相關(guān)文獻(xiàn)量與在檢索系統(tǒng)中相關(guān)文獻(xiàn)總量的比率,是衡量信息檢索系統(tǒng)漏檢文獻(xiàn)的尺度。

(4)誤檢率(Fall-out ratio),用F表示。誤檢率就是指誤檢(檢出不相關(guān))文獻(xiàn)總量的比率,是衡量信息檢索系統(tǒng)誤檢文獻(xiàn)和程度的尺度。

3.提高檢索效果的方法[1]

1.提高用戶使用信息檢索系統(tǒng)的能力

用戶要充分掌握檢索語言、檢索技巧和方法,在使用檢索工具和系統(tǒng)之前,要了解其性能與特點。這樣就能靈活、準(zhǔn)確地使用這些工具和系統(tǒng)來完成任務(wù)。

2.選用質(zhì)量高的檢索系統(tǒng)和工具

檢索工具和系統(tǒng)的收錄范圍、索引語言、標(biāo)引深度和準(zhǔn)確性以及提供的檢索途徑、檢索方法等都是影響檢索結(jié)果的重要方面,所以需要不斷地提高檢索工具和系統(tǒng)的質(zhì)量。

3.提高查全率和查準(zhǔn)率
1)提高查全率

當(dāng)前,常用的提高查全率的方法有以下6種。

(1)檢索詞的轉(zhuǎn)換。常見的轉(zhuǎn)換是同義詞、近義詞、相關(guān)詞、單復(fù)數(shù)及縮寫形式,如果是動詞,還可能有不同的時態(tài)。

(2)使用截詞符。我們要學(xué)會使用截詞符“?”、“*”。

(3)使用上位詞。使用上位詞即指代范圍更廣的詞。

(4)改變布爾運(yùn)算符。即將連接兩個或多個檢索詞的AND改為OR,可提高檢出的數(shù)囂。

(5)改變檢索項。若要求檢索詞位于標(biāo)題中,或為關(guān)鍵詞或主題,檢出記錄數(shù)太少,則可改為要求位于摘要或全文中,檢出記錄數(shù)即可增加。

(6)減少限制條件,增加副主題詞。如果前面的檢索中有條件,可放寬或去掉限制條件。

2)提高查準(zhǔn)率

盡管查準(zhǔn)率和查全率之間存在互逆的關(guān)系,但用戶還是可以通過采用分類和主題的方式使兩者的比率達(dá)到最優(yōu)。

(1)同時使用分類途徑和主題途徑,提高查全率和查準(zhǔn)率。

(2)從主題途徑入手,結(jié)合分類途徑對檢索策略進(jìn)行修正,提高查全率和查準(zhǔn)率。

4.影響檢索效果的因素[2]

查全率與查準(zhǔn)率是評價檢索效果的兩項重要指標(biāo)。查全率和查準(zhǔn)率與文獻(xiàn)的存儲與信息檢索兩個方面是直接相關(guān)的,也就是說影響查全率與查準(zhǔn)率的各種因素主要來自用戶與檢索人員的配合、檢索策略、標(biāo)引和檢索語言等方面。

1.標(biāo)引的影響

標(biāo)引人員標(biāo)引文獻(xiàn)的正確性對查全率與查準(zhǔn)率有直接影響。如果提取出來的不是有用信息,則以后查找時查準(zhǔn)率會降低;如果有用信息沒有被提取出來,則以后查找時查全率會降低。有用信息提取出來之后,如果將能夠響應(yīng)的某個查找要求遺漏掉,則用戶從這個查找中就查不到會有該有用信息的文獻(xiàn),因而查全率會降低。

文獻(xiàn)所能響應(yīng)的查找要求確定出來之后,在將其轉(zhuǎn)換成標(biāo)引詞的過程中,標(biāo)引人員遺漏了原文的重要概念,從而使查全率降低。選用了不合適的標(biāo)引詞,使得檢索人員利用這個詞查出的文獻(xiàn)是無關(guān)的,因而引起查準(zhǔn)率降低;或者檢索人員利用正確的標(biāo)引詞查找時,有關(guān)文獻(xiàn)因標(biāo)引了不合適的標(biāo)引詞而查不出來,則導(dǎo)致查全率降低。

2.檢索語言的影響

由檢索語言引起的查找失敗有兩種類型:一是因標(biāo)引詞專指性不足引起的查找失敗,一是因標(biāo)引詞之間的含糊關(guān)系或虛假關(guān)系引起的查找失敗。

標(biāo)引詞匯缺乏控制和專指性不足,是影響查準(zhǔn)率的不利因素,但高專指性的標(biāo)引詞在提高查準(zhǔn)率的同時有降低查全率的趨向。這是因為標(biāo)引詞的數(shù)目越多,能夠表達(dá)的意義差別也就越細(xì)致,標(biāo)引就越難于取得一致。

組配規(guī)則不嚴(yán)密,選詞及詞間關(guān)系不規(guī)范,或允許使用過多的標(biāo)引詞,則可能引起虛假組配現(xiàn)象,將使查準(zhǔn)率降低。

詞表結(jié)構(gòu)不完整,詞間關(guān)系模糊或不正確,標(biāo)引前后不一致,對查找有很大影響。如果詞表不以某種方式把所有關(guān)聯(lián)的標(biāo)引詞集中在一起,那些檢索人員就不能將與查找要求有關(guān)的全部標(biāo)引詞找出來,查全率就會降低。詞表對標(biāo)引也有很大影響,較好的詞表參照系統(tǒng)和等級結(jié)構(gòu)關(guān)系能夠提高查全率。

3.檢索策略的影響

所謂檢索策略就是為實現(xiàn)檢索沒目標(biāo)而制定的全盤計劃和方案,是對整個檢索過程的謀劃和指導(dǎo),如明確檢索要求、選擇檢索系統(tǒng)(工具)、檢索方法、檢索途徑等程序。為了更好地獲得滿意的檢索效果,在信息檢索過程中需要調(diào)整檢索策略。檢索策略主要取決于檢索人員的知識水平與業(yè)務(wù)能力,因此檢索策略的優(yōu)劣是影響檢索效率的主觀原因。

此外,文獻(xiàn)庫收錄文獻(xiàn)不全,檢索人員業(yè)務(wù)不熟練和缺乏耐心,檢索系統(tǒng)不具備截詞功能和反饋功能,檢索時不能全面地描述檢索要求等,就會影響查全率。索引詞不能準(zhǔn)確描述文獻(xiàn)主題和檢索要求,檢索式中允許容納的詞數(shù)量有限,截詞部位不當(dāng),檢索式中使用邏輯“或”不當(dāng)?shù)?,就會影響查?zhǔn)率。

評論  |   0條評論