<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    zhyiwww
    用平實(shí)的筆,記錄編程路上的點(diǎn)點(diǎn)滴滴………
    posts - 536,comments - 394,trackbacks - 0

    在用wget抓取數(shù)據(jù)的時(shí)候,有的時(shí)候需要用戶登錄才能進(jìn)行。這種情況下就需要時(shí)用cookie.
    先看下面的代碼:
     
    wget --load-cookies cookies.txt --save-cookies cookies.txt --keep-session-cookies -O output/login.html --post-data "username=NNNNNNNNNNN&password=MMMMMMMMMMM" http://www.xxxxxxxxxxxxxx.org/login
     
      wget --load-cookies cookies.txt --save-cookies cookies.txt --keep-session-cookies -O output/directory-list.html "http://www.xxxxxxxxxxxxxxx.org/list?category=resturants&page=1"
     
    第一個(gè)操作,就是先獲得一個(gè)cookie,用來(lái)登陸并保存此session,然后在后面的抓數(shù)據(jù)的過(guò)程中使用此session和cookie.
    注意:
    http://www.xxxxxxxxxxxxxx.org/login要換成對(duì)應(yīng)的登陸頁(yè)面的url
    --post-data "username=NNNNNNNNNNN&password=MMMMMMMMMMM"  post數(shù)據(jù)里面的參數(shù)要根據(jù)登陸頁(yè)面里面對(duì)應(yīng)的參數(shù)設(shè)定。

    第二個(gè)操作,就是用上面的cookie去驗(yàn)證用戶,并取得一個(gè)有效的連接,進(jìn)而去取得數(shù)據(jù)。
    --load-cookies 就是載入你上一個(gè)操作所取得的cookie.

    在抓取數(shù)據(jù)的時(shí)候,我自己用了一個(gè)腳本,如下,以供參考:

    get --load-cookies cookies.txt --save-cookies cookies.txt --keep-session-cookies -O login.html --post-data "username=xxxxxxxxxx&password=11111111111111111" http://www.mmmmmmmmmmmmmmmmmm.mmmmmmmmm/login
     
     
     
      for i in {1..89}
      do
          for j in {1..20}
          do
              echo i=$i -- j=$j
     
      echo "wget --load-cookies cookies.txt --save-cookies cookies.txt --keep-session-cookies  -O $i-$j.html 'http://www.ccccccccccccccc.ccccccccccc/directory/resturant/list?keyword=&class=$i&page=$j'"
     
      wget --no-dns-cache --no-cache --load-cookies cookies.txt --save-cookies cookies.txt --keep-session-cookies  -O $i-$j.html "http://www.qqqqqqqqq.xxxxxxxxx/directory/bar/list?keyword=&class=$i&page=$j"
     
          done









    |----------------------------------------------------------------------------------------|
                               版權(quán)聲明  版權(quán)所有 @zhyiwww
                引用請(qǐng)注明來(lái)源 http://m.tkk7.com/zhyiwww   
    |----------------------------------------------------------------------------------------|
    posted on 2009-10-27 18:20 zhyiwww 閱讀(3984) 評(píng)論(0)  編輯  收藏 所屬分類: linux
    主站蜘蛛池模板: 国产一级高清视频免费看| 麻豆亚洲AV成人无码久久精品| 国产一区在线观看免费| 精品福利一区二区三区免费视频| 一级一级毛片免费播放| 亚洲精品国产精品| 亚洲一区二区三区亚瑟| 亚洲精品在线观看视频| 亚洲中文字幕在线观看| 亚洲国产黄在线观看| 四虎影视大全免费入口| 国产免费毛不卡片| 日韩精品无码一区二区三区免费| 精品一区二区三区高清免费观看| 激情婷婷成人亚洲综合| 亚洲AV无码精品国产成人| 亚洲AV无码无限在线观看不卡| 亚洲成a人片在线观看播放| 亚洲视频国产精品| 亚洲黄色在线电影| 91大神亚洲影视在线| 亚洲国产综合专区电影在线| 国产AV无码专区亚洲AV男同| 精品亚洲成α人无码成α在线观看| 亚洲国产综合精品| 久久精品视频亚洲| 亚洲不卡av不卡一区二区| 中文字幕亚洲乱码熟女一区二区| 亚洲性日韩精品国产一区二区| 亚洲综合色在线观看亚洲| 亚洲精品尤物yw在线影院| 亚洲精品视频免费| 亚洲精品中文字幕乱码三区| 综合久久久久久中文字幕亚洲国产国产综合一区首 | 久久国产免费直播| 老司机精品免费视频| 黄色免费在线网站| 99re这里有免费视频精品| 日本免费一区二区在线观看| 久久经典免费视频| 好爽…又高潮了免费毛片|