登錄

查準(zhǔn)率

百科 > 信息管理術(shù)語 > 查準(zhǔn)率

1.什么是查準(zhǔn)率

查準(zhǔn)率是指檢出的相關(guān)文獻(xiàn)量與檢出文獻(xiàn)總量的比率,是衡量信息檢索系統(tǒng)檢出文獻(xiàn)準(zhǔn)確度的尺度。

2.查準(zhǔn)率的計(jì)算公式[1]

查準(zhǔn)率=

檢索出的相關(guān)信息量

× 100%

檢索出的信息總量

3.查準(zhǔn)率的局限性[1]

查準(zhǔn)率的局限性主要表現(xiàn)在:如果檢索結(jié)果是題錄式而非全文式,由于題錄的內(nèi)容簡單,用戶很難判斷檢索到的信息是否與課題密切相關(guān),必須找到該題錄的全文,才能正確判斷出該信息是否符合檢索課題的需要;同時(shí),查準(zhǔn)率中所講的相關(guān)信息也具有“假設(shè)”的局限性。實(shí)驗(yàn)證明,在查全率和查準(zhǔn)率之間存在著相反的相互依賴關(guān)系:如果提高輸出的查全率,就會(huì)降低其查準(zhǔn)率;反之亦然。

4.影響查準(zhǔn)率的因素[2]

影響查準(zhǔn)率的因素主要有:索引詞不能準(zhǔn)確描述文獻(xiàn)主題和檢索要求;組配規(guī)則不嚴(yán)密;選詞及詞間關(guān)系不正確;標(biāo)引過于詳盡;組配錯(cuò)誤;檢索時(shí)所用檢索詞(或檢索式)專指度不夠,檢索面寬于檢索要求;檢索系統(tǒng)不具備邏輯“非”功能和反饋功能;檢索式中允許容納的詞數(shù)量有限;截詞部位不當(dāng),檢索式中使用邏輯“或”不當(dāng)?shù)鹊取?

實(shí)際上,影響檢索效果的因素是非常復(fù)雜的。根據(jù)國外有關(guān)專家所做的實(shí)驗(yàn)表明,查全率與查準(zhǔn)率是呈反比關(guān)系的。要想做到查全,勢必會(huì)要對檢索范圍和限制逐步放寬,則結(jié)果是會(huì)把很多不相關(guān)的文獻(xiàn)也帶進(jìn)來,影響了查準(zhǔn)率。企圖使查全率和查準(zhǔn)率都同時(shí)提高,不是很容易的。強(qiáng)調(diào)一方面,忽視另一方面,也是不妥當(dāng)?shù)?。?yīng)當(dāng)根據(jù)具體課題的要求,合理調(diào)節(jié)查全率和查準(zhǔn)率,保證檢索效果。

5.提高查準(zhǔn)率的具體方法[3]

在檢索系統(tǒng)和數(shù)據(jù)庫確定的前提下,若要提高文獻(xiàn)檢索的查準(zhǔn)率,選擇主題詞范圍就要窄一點(diǎn),專指度要高一些,邏輯算符應(yīng)選擇具有縮檢意義的“邏輯與”。

1.選擇主要概念和基本概念

為了提高查準(zhǔn)率,應(yīng)在多個(gè)主題概念中選擇主要概念和基本概念,刪除重復(fù)概念。例如,檢索“空氣中鉛污染問題的研究”這一課題,空氣中含鉛必然是污染問題,故“污染”是個(gè)可舍去的重復(fù)概念;“研究”是個(gè)廣泛概念,既然是討論空氣中的鉛污染,必然帶“研究”性質(zhì),故亦應(yīng)舍去;余下的主題概念應(yīng)簡化為:“空氣”、“鉛”,用“空氣AND鉛”這_組配檢索,不但檢準(zhǔn)率高,而且檢索效果最好。

2.提高主題詞的專指度

為提高文獻(xiàn)檢索的查準(zhǔn)率,選擇主題詞時(shí)應(yīng)盡量避免選擇外延廣泛的上位詞,而應(yīng)增加或換用專指性較強(qiáng)的主題詞和下位詞進(jìn)行檢索。例如,從篇名查找有關(guān)“水果罐頭加工技術(shù)”的文獻(xiàn),采用外延廣泛的上位詞“罐頭”進(jìn)行檢索,即使利用限定詞“加工”進(jìn)一步限制檢索范圍,其查準(zhǔn)率還是較低,檢出了許多不相關(guān)的文獻(xiàn);選用專指詞“水果”與“罐頭”進(jìn)行檢索,大大提高了查準(zhǔn)率,但可作參考的文獻(xiàn)較少;相應(yīng)地增加下位主題詞“桔子、蘋果、菠蘿”與“罐頭”組配檢索,不但檢準(zhǔn)率高,而且選中的文獻(xiàn)亦大大增加。

3.選擇規(guī)范專業(yè)用語檢索

許多全文數(shù)據(jù)庫采用關(guān)鍵詞(即自由詞)檢索。關(guān)鍵詞未經(jīng)詞形控制及詞義控制,這使得檢索語言中存在大量的同義詞、近義詞、多義詞、同形異義詞和詞義含糊而導(dǎo)致理解不一的詞,因此,簡單的關(guān)鍵詞檢索往往會(huì)降低檢索質(zhì)量。為了提高檢索的查準(zhǔn)率,在選擇主題詞時(shí)應(yīng)選擇規(guī)范的專業(yè)術(shù)語,例如用“泡沫塑料”代替“海綿”,用“維生素c”代替“抗壞血酸”或“維他命c(diǎn)”,用“偏癱”代替“半身不遂”等。對于本身具有多義性的關(guān)鍵詞,可采用與主題密切相關(guān)的其他主題詞進(jìn)行限制,例如查找有關(guān)“DNA脫氧核糖核酸”的文獻(xiàn),若用“DNA”進(jìn)行檢索,從篇名查得文獻(xiàn)較多,這使檢索結(jié)果包含了大量不相關(guān)的文獻(xiàn);如果用“DNAAND脫氧核糖核酸”進(jìn)行組配,結(jié)果命中文獻(xiàn)較少,大大提高了查準(zhǔn)率。

4.采用“邏輯與”組配

在文獻(xiàn)檢索過程中,單個(gè)主題詞的計(jì)算機(jī)檢索比較簡單,2個(gè)或2個(gè)以上的主題詞則需要先根據(jù)檢索課題的要求對主題詞進(jìn)行組配?!斑壿嬇c”組配具有縮檢功能,因此要提高檢索的查準(zhǔn)率,可用“AND”連接一些能進(jìn)一步限定主題概念的相關(guān)檢索項(xiàng)。例如,查找“轉(zhuǎn)基因作物安全性”方面的文獻(xiàn),檢索式可制訂為:轉(zhuǎn)基因作物AND安全性。

評論  |   0條評論