亚洲无线码一区二区三区,亚洲一区二区三区AV无码,亚洲国产精品自在在线观看

傳統搜索引擎綜述

傳統搜索引擎的工作原理：
1）從互聯網上抓取網頁
利用能夠從互聯網上自動收集網頁的Spider系統程序，自動訪問互聯網，并沿著任何網頁中的所有URL爬到其它網頁，重復這過程，并把爬過的所有網頁收集回來。
2）建立索引數據庫
由分析索引系統程序對收集回來的網頁進行分析，提取相關網頁信息（包括網頁所在URL、編碼類型、頁面內容包含的所有關鍵詞、關鍵詞位置、生成時間、大小、與其它網頁的鏈接關系等），根據一定的相關度算法進行大量復雜計算，得到每一個網頁針對頁面文字中及超鏈中每一個關鍵詞的相關度（或重要性），然后用這些相關信息建立網頁索引數據庫。
3）在索引數據庫中搜索排序
當用戶輸入關鍵詞搜索后，由搜索系統程序從網頁索引數據庫中找到符合該關鍵詞的所有相關網頁。因為所有相關網頁針對該關鍵詞的相關度早已算好，所以只需按照現成的相關度數值排序，相關度越高，排名越靠前。最后，由頁面生成系統將搜索結果的鏈接地址和頁面內容摘要等內容組織起來返回給用戶。

傳統的搜索引擎一般使用兩種技術來實現信息檢索:
1.使用網站分類技術實現目錄檢索，即把網站進行樹狀的歸類，登陸的網站屬于至少一個類別，對每個站點都有簡略的描述。Yahoo采用了這種方法。為了分類科學準確，需要有一支各科人才組成的維護隊伍。
2.使用全文檢索技術。全文檢索技術處理的對象是文本，它能夠對大量文檔建立由字（詞）到文檔的倒排索引，在此基礎上，用戶使用關鍵詞來對文檔進行查詢時，系統將給用戶返回該關鍵詞的網頁。

posted on 2010-04-02 09:58 Ying-er 閱讀(321) 評論(0) 編輯收藏

常用鏈接

留言簿(4)

隨筆分類

隨筆檔案

友情鏈接

各人常用鏈接

搜索

積分與排名

最新評論

閱讀排行榜


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理