<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-23  評論-58  文章-0  trackbacks-0
    http://m.tkk7.com/nianzai/

    PDF文檔下載

    一、 概述
    在網頁抓取項目中通常最缺的是IP地址資源,大多數網站對抓取會做些限制(比如同一IP地址的線程數限制,再比如幾分鐘之內同一IP地址的頁面訪問次數限制)。
    基于P2P模式的分布式抓取方案是利用分散在各處的可上網機器來抓取網頁,可有效的突破網站限制。

    二、設計圖

    上網客戶端1 。。。上網客戶端m是分散在各處能直接上網的機器,這些上網客戶端機器定時向狀態服務區報告自己的心跳。

    抓取客戶端 1 。。。抓取客戶端 n 是集中放在某處的抓取機器。抓取客戶端機器定時向狀態服務器獲取可用上網客戶端列表,然后抓取客戶端機器直接與上網客戶端建立連接,抓取客戶端機器直接通過上網客戶端來抓取網頁。

     

    三、實現方案

    方案一:
    在上網客戶端機器上安裝共享上網代理軟件比如ccproxy,抓取客戶端以代理的方式通過上網機器抓取網頁。該方案簡單易行,無技術障礙。


    方案二:
    開發一套簡化版P2P軟件,抓取客戶端機器將抓取請求分發給客戶端機器,客戶端機器將網頁抓取下來傳回給抓取客戶端機器。該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。

    posted on 2010-12-29 15:47 nianzai 閱讀(2237) 評論(2)  編輯  收藏

    評論:
    # re: 基于P2P模式的分布式抓取方案 2010-12-30 11:40 | 水星家紡
    該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。

      回復  更多評論
      
    # re: 基于P2P模式的分布式抓取方案 2010-12-30 12:30 | 打底褲
    該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。  回復  更多評論
      

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 亚洲美免无码中文字幕在线| 区三区激情福利综合中文字幕在线一区亚洲视频1 | 亚洲精品无码99在线观看 | 亚洲人成电影网站免费| 免费视频专区一国产盗摄| 亚洲免费闲人蜜桃| 国内一级一级毛片a免费| 亚洲专区中文字幕| 成人毛片免费视频| 自拍偷自拍亚洲精品偷一| 亚洲国产综合精品一区在线播放| 免费的黄色网页在线免费观看| 亚洲毛片网址在线观看中文字幕| 一级毛片免费在线| 亚洲国产成人一区二区三区| 青青草无码免费一二三区| 亚洲国产精品成人久久久| 午夜毛片不卡免费观看视频| 边摸边吃奶边做爽免费视频99 | 亚洲精品色婷婷在线影院| 久久一区二区免费播放| 亚洲av日韩av无码黑人| 免费国产作爱视频网站| 国产精品亚洲精品爽爽| 国内精品99亚洲免费高清| 97av免费视频| 成人A级毛片免费观看AV网站| 亚洲国产无线乱码在线观看| 2048亚洲精品国产| 91精品视频在线免费观看| 亚洲熟妇无码一区二区三区 | 亚洲av午夜成人片精品网站| 亚洲精品视频免费在线观看| 国产AV旡码专区亚洲AV苍井空| 免费看小12萝裸体视频国产 | 美女裸体无遮挡免费视频网站| 亚洲自偷自偷图片| 蜜桃视频在线观看免费网址入口 | 在线人成精品免费视频| 亚洲GV天堂GV无码男同| 久久精品国产69国产精品亚洲|