網(wǎng)絡(luò)信息檢索工具
目錄
1.什么是網(wǎng)絡(luò)信息檢索工具
網(wǎng)絡(luò)信息檢索工具是指在因特網(wǎng)上提供信息檢索服務(wù)的計(jì)算機(jī)系統(tǒng),其檢索的對(duì)象是存在于因特網(wǎng)信息空間中各種類型的網(wǎng)絡(luò)信息資源。
2.網(wǎng)絡(luò)檢索工具的特點(diǎn)[1]
- 1.信息檢索服務(wù)的開(kāi)放性
在因特網(wǎng)這個(gè)大型系統(tǒng)中包含信息資源、信息設(shè)備、信息通道、信息檢索軟件及信息終端等子系統(tǒng),各個(gè)子系統(tǒng)都是開(kāi)放的,而其信息資源面向所有用戶
- 2.超文本的多鏈接性
以超文本技術(shù)為基礎(chǔ)鏈結(jié)構(gòu)將小同地方的相關(guān)信息有機(jī)聯(lián)系起來(lái),使用戶可以通過(guò)點(diǎn)擊文本或圖表中的超文本鏈接點(diǎn)訪問(wèn)另一個(gè)相關(guān)的文檔,不僅能夠指向同一文檔中的不同段落,同一服務(wù)器的不同目錄和文檔,還可以指向世界上任何地方任何服務(wù)器及其任何目錄的文件。通過(guò)這些鏈接,信息檢索能夠以交互和跳躍式的方式進(jìn)行,從而達(dá)到瀏覽檢索的目的。
- 3.操作的簡(jiǎn)易性
網(wǎng)絡(luò)信息檢索工具一般采用Client/Server結(jié)構(gòu),通過(guò)交互式的圖形界面,為用戶提供友好的信息查詢要求,系統(tǒng)就會(huì)自動(dòng)向適當(dāng)?shù)姆?wù)器提出請(qǐng)求,使因特網(wǎng)檢索資源能夠廣泛地深入到學(xué)校、家庭、辦公室乃至每一個(gè)人。
3.網(wǎng)絡(luò)檢索工具的工作原理[2]
網(wǎng)絡(luò)信息檢索工具的工作原理可以概括為:通過(guò)自動(dòng)索引程序robot(或人工)來(lái)廣泛搜集網(wǎng)絡(luò)信息資源數(shù)據(jù),經(jīng)過(guò)一系列的判斷、選擇、標(biāo)引、加工、分類、組織等處理后形成供檢索用的數(shù)據(jù)庫(kù),創(chuàng)建目錄索引,并大多以Web頁(yè)面的形式向用戶提供有關(guān)的資源導(dǎo)航、目錄索引及檢索界面。用戶可根據(jù)自己的信息查找要求,按照該檢索工具的句法要求等來(lái)通過(guò)檢索界面輸入想要查找的檢索項(xiàng)、提問(wèn)式。系統(tǒng)檢索軟件接受用戶提交的檢索提問(wèn)后,按照本系統(tǒng)的句法規(guī)定對(duì)用戶輸入的字符串、運(yùn)算符、標(biāo)識(shí)符、空格等進(jìn)行識(shí)別后,代理用戶在數(shù)據(jù)庫(kù)中檢索,并對(duì)檢索結(jié)果進(jìn)行評(píng)估比較,按與檢索結(jié)果的相關(guān)程度排序后提供給用戶。
4.網(wǎng)絡(luò)信息檢索工具的分類[1]
網(wǎng)絡(luò)信息檢索工具按其檢索方式與所對(duì)應(yīng)的檢索資源大體分為以下幾種類型:
- 1.FTP(文件傳輸協(xié)議)類的檢索工具
這是一種實(shí)時(shí)的聯(lián)機(jī)檢索工具,用戶首先要登錄到對(duì)方的計(jì)算機(jī),登錄后即可以進(jìn)行文獻(xiàn)搜索及文獻(xiàn)傳輸有關(guān)的操作。使用FTP幾乎可以傳輸任何類型的正文文件、二進(jìn)制文件、圖像文件、聲音文件、數(shù)據(jù)壓縮文件等。在這類檢索工具中,Archie是最常用的。Archie是自動(dòng)標(biāo)題檢索軟件,它借助于FTP來(lái)訪問(wèn)。用戶只需告訴其要檢索文件名的有關(guān)信息便可獲得文件所在的主機(jī)名、路徑。有了這些信息后,用戶可以利用FTP獲得自己想要的文件。與一般檢索工具不同的是,它不用主題來(lái)實(shí)現(xiàn)相應(yīng)的檢索,而只能根據(jù)文件名和目錄名進(jìn)行檢索。
- 2.基于菜單式的檢索工具
這類檢索工具是一種分布式信息查詢工具,它將用戶的請(qǐng)求自動(dòng)轉(zhuǎn)換成FTP或Telnet命令,在一級(jí)一級(jí)的菜單引導(dǎo)下,用戶可以選取自己感興趣的信息資源。這對(duì)于不熟悉網(wǎng)絡(luò)資源、網(wǎng)絡(luò)地址和查詢命令的用戶是十分簡(jiǎn)便的方法。在這類檢索工具中最常見(jiàn)的是Veronica和Jughead。如Veronica用于檢索可由Go—pher菜單訪問(wèn)的信息資源,是與Gopher配套的檢索工具。它根據(jù)用戶給出的檢索詞進(jìn)行檢索,可檢索文件名、目錄名、文檔及其他信息資源。
- 3.基于關(guān)鍵詞的檢索工具
WAIS(wide area information serve)信息服務(wù)軟件是基于關(guān)鍵詞的檢索工具。使用WAIS用戶不必操心檢索信息在網(wǎng)絡(luò)中的哪臺(tái)計(jì)算機(jī)上,也不用關(guān)心如何去獲取這些文件。WAIS檢索步驟如下:先從WAIS給出的數(shù)據(jù)庫(kù)中用光標(biāo)選擇自己希望檢索的數(shù)據(jù)源名稱;在選定的數(shù)據(jù)源范圍內(nèi)進(jìn)行關(guān)鍵詞檢索,系統(tǒng)會(huì)自動(dòng)進(jìn)行遠(yuǎn)程檢索;查詢完成后,WAIS在顯示檢索結(jié)果時(shí),將結(jié)果與檢索詞按相關(guān)度權(quán)數(shù)大小排列,供用戶選擇;WAIS不僅可以顯示文件的出處,而且可以將文件中的信息顯示出來(lái),供用戶聯(lián)機(jī)瀏覽。
- 4.基于超文本式的檢索工具
著名的www是一種基于超文本方式的信息查詢工具,通過(guò)將位于全世界因特網(wǎng)上的各站點(diǎn)的相關(guān)數(shù)據(jù)庫(kù)信息有機(jī)地編織在一起,從而提供了一種界面友好的信息查詢接口,用戶只需要提出查詢要求,至于到什么地方查詢以及如何查詢均由Www自動(dòng)完成。www上的檢索工具按其搜索的數(shù)據(jù)庫(kù)類型可劃分為指南類和檢索類。指南類的數(shù)據(jù)庫(kù)包括了Web文檔標(biāo)題索引樹(shù)、URL和描述信息的數(shù)據(jù)庫(kù),而且包含部分文檔的關(guān)鍵詞、摘要,甚至全文信息,這類程序庫(kù)是由程序來(lái)創(chuàng)建和維護(hù)的,用戶可以依靠這些程序定期訪問(wèn)LycoS、Web2Crawler、Alta、Vista、Excite、InfoSeek等。www上的檢索工具不僅可以搜索www上的信息,也可以搜索因特網(wǎng)上的其他信息資源,如FTP、Gopher、新聞組等,www大有成為因特網(wǎng)上標(biāo)準(zhǔn)檢索工具的趨勢(shì)。
- 5.多元搜索引擎
多元搜索引擎是將多個(gè)搜索引擎集成在一起,并提供一個(gè)統(tǒng)一的檢索界面;且將一個(gè)檢索提問(wèn)同時(shí)發(fā)送給多個(gè)搜索引擎,同時(shí)檢索多個(gè)數(shù)據(jù)庫(kù),再經(jīng)過(guò)聚合、去重之后輸出檢索結(jié)果。其優(yōu)點(diǎn)是省時(shí),缺點(diǎn)是由于不同搜索引擎的檢索機(jī)制、所支持的檢索算法、對(duì)提問(wèn)式的解讀等均不相同,導(dǎo)致檢索結(jié)果的準(zhǔn)確性差,且速度慢。