<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-23  評論-58  文章-0  trackbacks-0
    http://m.tkk7.com/nianzai/

    PDF文檔下載

    一、 概述
    在網頁抓取項目中通常最缺的是IP地址資源,大多數網站對抓取會做些限制(比如同一IP地址的線程數限制,再比如幾分鐘之內同一IP地址的頁面訪問次數限制)。
    基于P2P模式的分布式抓取方案是利用分散在各處的可上網機器來抓取網頁,可有效的突破網站限制。

    二、設計圖

    上網客戶端1 。。。上網客戶端m是分散在各處能直接上網的機器,這些上網客戶端機器定時向狀態服務區報告自己的心跳。

    抓取客戶端 1 。。。抓取客戶端 n 是集中放在某處的抓取機器。抓取客戶端機器定時向狀態服務器獲取可用上網客戶端列表,然后抓取客戶端機器直接與上網客戶端建立連接,抓取客戶端機器直接通過上網客戶端來抓取網頁。

     

    三、實現方案

    方案一:
    在上網客戶端機器上安裝共享上網代理軟件比如ccproxy,抓取客戶端以代理的方式通過上網機器抓取網頁。該方案簡單易行,無技術障礙。


    方案二:
    開發一套簡化版P2P軟件,抓取客戶端機器將抓取請求分發給客戶端機器,客戶端機器將網頁抓取下來傳回給抓取客戶端機器。該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。

    posted on 2010-12-29 15:47 nianzai 閱讀(2237) 評論(2)  編輯  收藏

    評論:
    # re: 基于P2P模式的分布式抓取方案 2010-12-30 11:40 | 水星家紡
    該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。

      回復  更多評論
      
    # re: 基于P2P模式的分布式抓取方案 2010-12-30 12:30 | 打底褲
    該方案復雜些,但可擴展性極強。在掌握了大量上網客戶端機器后完全可以做成云計算進行商業運作。  回復  更多評論
      

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 免费h片在线观看网址最新| 国产无遮挡无码视频免费软件| 亚洲AV成人一区二区三区AV| 国产AV无码专区亚洲Av| 亚洲视频在线不卡| 亚洲成_人网站图片| 免费视频成人国产精品网站| 免费无码黄网站在线看| 成人毛片免费观看| 亚洲欧洲自拍拍偷精品 美利坚 | 亚洲狠狠婷婷综合久久蜜芽| 疯狂做受xxxx高潮视频免费| 99久久免费国产精品热| 成人毛片视频免费网站观看| 亚洲一区二区三区在线观看网站| 免费看无码特级毛片| 亚洲成AV人在线观看天堂无码| 99在线在线视频免费视频观看| 免费人成在线观看视频播放| 亚洲综合婷婷久久| 男人和女人高潮免费网站| 亚洲精品国产va在线观看蜜芽| 国产亚洲精品免费视频播放| 国产成人免费福利网站| 99ri精品国产亚洲| 无码日韩精品一区二区免费| 亚洲精品tv久久久久久久久 | 免费一级特黄特色大片在线观看| 国产亚洲欧美日韩亚洲中文色| 亚洲精品视频在线免费| 亚洲精品无码久久久久| 7m凹凸精品分类大全免费| 亚洲国产精品无码专区影院 | 免费的一级黄色片| 亚洲视频在线不卡| 国产免费观看网站| 亚洲第一第二第三第四第五第六| 亚洲天堂免费在线视频| 女bbbbxxxx另类亚洲| 久久国产亚洲电影天堂| 麻豆精品国产免费观看|