<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    zhyiwww
    用平實的筆,記錄編程路上的點點滴滴………
    posts - 536,comments - 394,trackbacks - 0

    在用wget抓取數據的時候,有的時候需要用戶登錄才能進行。這種情況下就需要時用cookie.
    先看下面的代碼:
     
    wget --load-cookies cookies.txt --save-cookies cookies.txt --keep-session-cookies -O output/login.html --post-data "username=NNNNNNNNNNN&password=MMMMMMMMMMM" http://www.xxxxxxxxxxxxxx.org/login
     
      wget --load-cookies cookies.txt --save-cookies cookies.txt --keep-session-cookies -O output/directory-list.html "http://www.xxxxxxxxxxxxxxx.org/list?category=resturants&page=1"
     
    第一個操作,就是先獲得一個cookie,用來登陸并保存此session,然后在后面的抓數據的過程中使用此session和cookie.
    注意:
    http://www.xxxxxxxxxxxxxx.org/login要換成對應的登陸頁面的url
    --post-data "username=NNNNNNNNNNN&password=MMMMMMMMMMM"  post數據里面的參數要根據登陸頁面里面對應的參數設定。

    第二個操作,就是用上面的cookie去驗證用戶,并取得一個有效的連接,進而去取得數據。
    --load-cookies 就是載入你上一個操作所取得的cookie.

    在抓取數據的時候,我自己用了一個腳本,如下,以供參考:

    get --load-cookies cookies.txt --save-cookies cookies.txt --keep-session-cookies -O login.html --post-data "username=xxxxxxxxxx&password=11111111111111111" http://www.mmmmmmmmmmmmmmmmmm.mmmmmmmmm/login
     
     
     
      for i in {1..89}
      do
          for j in {1..20}
          do
              echo i=$i -- j=$j
     
      echo "wget --load-cookies cookies.txt --save-cookies cookies.txt --keep-session-cookies  -O $i-$j.html 'http://www.ccccccccccccccc.ccccccccccc/directory/resturant/list?keyword=&class=$i&page=$j'"
     
      wget --no-dns-cache --no-cache --load-cookies cookies.txt --save-cookies cookies.txt --keep-session-cookies  -O $i-$j.html "http://www.qqqqqqqqq.xxxxxxxxx/directory/bar/list?keyword=&class=$i&page=$j"
     
          done









    |----------------------------------------------------------------------------------------|
                               版權聲明  版權所有 @zhyiwww
                引用請注明來源 http://m.tkk7.com/zhyiwww   
    |----------------------------------------------------------------------------------------|
    posted on 2009-10-27 18:20 zhyiwww 閱讀(3984) 評論(0)  編輯  收藏 所屬分類: linux
    主站蜘蛛池模板: 丁香花在线观看免费观看图片| 偷自拍亚洲视频在线观看99| 久久美女网站免费| va亚洲va日韩不卡在线观看| 精品特级一级毛片免费观看| 免费人成在线观看网站视频| 偷自拍亚洲视频在线观看 | 亚洲中文字幕视频国产| 一本久久免费视频| 亚洲伊人久久精品影院| 91国内免费在线视频| 亚洲Av永久无码精品三区在线 | 四虎1515hm免费国产| 色婷婷精品免费视频| 亚洲一区二区精品视频| 任你躁在线精品免费| 久久精品国产亚洲AV电影| 妻子5免费完整高清电视| 亚洲熟女www一区二区三区| 国产精品自在自线免费观看| 日韩在线一区二区三区免费视频| 亚洲一区二区三区无码影院| 可以免费观看的毛片| 亚洲国产成人va在线观看网址| 影音先锋在线免费观看| 人妻仑乱A级毛片免费看| 国产v亚洲v天堂无码网站| 亚洲一区二区三区免费观看| 亚洲欧美日韩一区二区三区| 亚洲精品无码99在线观看| 国产一级片免费看| www.亚洲成在线| 亚洲色欲久久久久综合网| 免费精品无码AV片在线观看| 亚洲私人无码综合久久网| 久久久久久亚洲精品不卡| 曰批视频免费40分钟试看天天| 国产精品亚洲AV三区| 亚洲成亚洲乱码一二三四区软件| 1000部拍拍拍18勿入免费凤凰福利| 亚洲av午夜国产精品无码中文字 |