<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    zhyiwww
    用平實(shí)的筆,記錄編程路上的點(diǎn)點(diǎn)滴滴………
    posts - 536,comments - 394,trackbacks - 0

    在你抓取到的html文件,如果想查找并選出一個(gè)標(biāo)簽間的內(nèi)容的話,就需要使用多行匹配。這一點(diǎn)上grep不能提供此功能。所以就可以使用sed的多行匹配功能。
    比如,你想選出
    <html>
    <body>
    <div class="info">
    ......
    ......
    </div>

    </body>
    </html>

    兩個(gè)div標(biāo)簽之間的內(nèi)容。
    可以用下面的方法
      $ sed -n -e '/<div>/p' -e '/<div class=\"info\">/,/<\/div>/p' *.html >  all.html


    以上方法參考自此文章http://www.fwolf.com/blog/post/346,這篇文章寫得很好。

    以下內(nèi)容均引自上述文章。

    Update @ 2007-12-14

    在和bxy討論的過程中,又發(fā)現(xiàn)sed的另外一種用途,從html或xml中按照tag對應(yīng)關(guān)系,篩選打印出指定的tag內(nèi)容,使用了正則中的p命令,好像默認(rèn)就沒有“不能處理多行內(nèi)容”以及“貪婪性”的問題,很好用,很強(qiáng)大:

        $ sed -n -e '/<title>/p' -e '/<text /,/<\/text>/p' from.xml

    注意/<\/text>/不在同一行的時(shí)候才好用,不然會匹配到下一個(gè)實(shí)例出現(xiàn)的位置作為結(jié)束邊界。






    |----------------------------------------------------------------------------------------|
                               版權(quán)聲明  版權(quán)所有 @zhyiwww
                引用請注明來源 http://m.tkk7.com/zhyiwww   
    |----------------------------------------------------------------------------------------|
    posted on 2009-10-29 18:10 zhyiwww 閱讀(8443) 評論(0)  編輯  收藏 所屬分類: linux
    主站蜘蛛池模板: 亚洲午夜无码久久久久软件| 亚洲午夜在线一区| 搜日本一区二区三区免费高清视频| 西西大胆无码视频免费| 最新国产成人亚洲精品影院| 免费精品国产自产拍在线观看图片| 亚洲成人动漫在线观看| 国产情侣激情在线视频免费看 | 亚洲精品无码AV中文字幕电影网站| 亚洲国产欧洲综合997久久| 日韩免费高清一级毛片在线| 国产精品亚洲а∨天堂2021| 亚洲精品97久久中文字幕无码| 五月天婷婷免费视频| 亚洲日本一区二区三区在线 | 我的小后妈韩剧在线看免费高清版 | 不卡一卡二卡三亚洲| 一本久久A久久免费精品不卡| 国产福利免费在线观看| 免费国产va在线观看| a级亚洲片精品久久久久久久| 另类免费视频一区二区在线观看| 老汉色老汉首页a亚洲| 国产精品成人免费一区二区| 美女视频黄a视频全免费网站色 | 四虎影永久在线高清免费| 久久久久久av无码免费看大片| 亚洲a在线视频视频| 一级女人18毛片免费| 国产AV无码专区亚洲AV琪琪| 亚洲乱码中文字幕久久孕妇黑人 | 精品一卡2卡三卡4卡免费视频| 亚洲国产成人va在线观看网址| 国产精品国产午夜免费福利看 | 免费专区丝袜脚调教视频| 亚洲AV无码专区在线厂| 亚洲动漫精品无码av天堂| 在线免费观看视频你懂的| 两性色午夜视频免费网| 国产AV旡码专区亚洲AV苍井空| 久久久久国产亚洲AV麻豆|