登錄

個性化搜索

百科 > 計算機 > 個性化搜索

1.什么是個性化搜索

  個性化搜索主要是指按照用戶個性化需求,將Web網(wǎng)絡(luò)上獲取的相關(guān)信息與用戶檢索的信息進行匹配,把相似度高的信息排列在前面供用戶查詢。具體地說,首先應(yīng)該對用戶的個性化特征進行識別,得到用戶的個性化模式,然后利用已有的Web信息資源進行匹配,最后提供給用戶滿足其個性化需求的信息內(nèi)容。

2.個性化搜索引擎的原理

  個性化搜索引擎的實質(zhì)就是,對用戶的檢索詞在傳統(tǒng)算法的基礎(chǔ)之上,結(jié)合個性化信息對搜索結(jié)果進行自動的擴展,這種擴展基于對不同用戶模型因素的分析。個性化搜索的實現(xiàn)大致應(yīng)該分為兩個主要過程:

  第一個過程,個性化搜索引擎應(yīng)該是建立在基于排序算法的傳統(tǒng)搜索引擎基礎(chǔ)之上的,也就是說如果為用戶提供的搜索結(jié)果,必須先要通過蜘蛛程序爬行和抓取、過濾、索引和排序等過程,獲得大量的網(wǎng)頁比建立索引庫,當用戶輸人某個關(guān)鍵詞查詢信息時,搜索引擎會返回相關(guān)的內(nèi)容,并根據(jù)相應(yīng)的算法規(guī)則進行排序,從而展現(xiàn)給用戶。

  第二個過程,搜索引擎通過獲取用戶的歷史搜索記錄,進行分析并建立用戶模型,當在用戶搜索某些關(guān)鍵詞的時候,就能返回與用戶興趣相符的搜索結(jié)果,從而提高用戶搜索體驗。

3.個性化搜索引擎的基本流程

  個性化搜索引擎就是從索引庫中提取相關(guān)結(jié)果時,將用戶的興趣和偏好等信息包含參考進去,因此搜集用戶的興趣模型,并且將用戶模型整合進搜索引擎當中,是個陛化搜索引擎研究的重要內(nèi)容。個性化搜索的基本流程都分為四步:

  1.根據(jù)用戶檢索,獲得原有的搜索系統(tǒng)的檢索結(jié)果集。

  2.根據(jù)用戶模型和檢索結(jié)果集,在線的計算每個結(jié)果文檔的個性化權(quán)值。其實質(zhì)是用戶模型和文檔的相似度計算,將用戶最希望得到的結(jié)果加權(quán),這正是個性化搜索的核心。

  3.與其它排序權(quán)值結(jié)合,對搜索結(jié)果進行重排。

  4.展現(xiàn)搜索結(jié)果,并收集用戶對搜索結(jié)果的反饋信息,為下一次用戶搜索做準備。

4.個性化搜索引擎與傳統(tǒng)搜索引擎的區(qū)別

  (一)搜索引擎索引庫的范圍不同

  傳統(tǒng)搜索,是基于搜索引擎排序算法的搜索簡稱,傳統(tǒng)搜索引擎獲得的排序結(jié)果完全是通過蜘蛛程序的抓取大量的網(wǎng)頁,建立統(tǒng)一的索引庫,針對所有用戶使用相同的索引庫,而個性化搜索引擎在統(tǒng)一的搜索引擎索引庫基礎(chǔ)之上,增加了用戶模型數(shù)據(jù)庫,相當于對統(tǒng)一的索引庫進行了個眭化的擴展。

  (二)用戶搜索行為之間的關(guān)系不同

  用戶傳統(tǒng)搜索的每個搜索及點擊行為之間都是獨立的,在一定時間內(nèi)用戶搜索同一關(guān)鍵詞所看到的搜索結(jié)果大致相同,即使一個用戶搜索并點擊同一搜索結(jié)果,其搜索行為也不會對他人搜索同樣的結(jié)果會產(chǎn)生影響。而用戶個性化搜索的每個搜索行為之間是相互聯(lián)系的,用戶個人的搜索行為@X~~-V-次的搜索排名或展現(xiàn)結(jié)果產(chǎn)生影響,因為搜索引擎會根據(jù)用戶的以前的搜索記錄提供個性化的結(jié)果。

  (三)搜索結(jié)果的確定性和多變性

  對于同一關(guān)鍵詞,傳統(tǒng)搜索對不同的人展現(xiàn)的搜索結(jié)果是大致相同的,而個性化的搜索結(jié)果會根據(jù)每個人的歷史搜索記錄及偏好等因素,重新對結(jié)果進行再排序,過濾掉不相關(guān)的搜索結(jié)果,將符合用戶的搜索結(jié)果排到前面,而且不同的人搜索同樣的內(nèi)容,獲得的搜索結(jié)果可能有很大的差異。

  (四)搜索準確程度的不同

  傳統(tǒng)搜索引擎的搜索結(jié)果是適合大多數(shù)人的習(xí)慣和偏好,采用投票的形式對網(wǎng)站的重要性及受歡迎程度進行判斷,排名結(jié)果符合大多數(shù)人,從而證明大多數(shù)人都點擊的網(wǎng)站一定是新訪問者所需要的結(jié)果;但是,個性化搜索引擎更加偏重于搜索者本身的喜好,其經(jīng)常訪問的網(wǎng)站對其本人來說就是比較重要的,當他搜索相關(guān)的關(guān)鍵詞時,該網(wǎng)站就會相應(yīng)的排在前面,提高了搜索的精確性。

評論  |   0條評論