<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    zhyiwww
    用平實(shí)的筆,記錄編程路上的點(diǎn)點(diǎn)滴滴………
    posts - 536,comments - 394,trackbacks - 0

    在你抓取到的html文件,如果想查找并選出一個(gè)標(biāo)簽間的內(nèi)容的話,就需要使用多行匹配。這一點(diǎn)上grep不能提供此功能。所以就可以使用sed的多行匹配功能。
    比如,你想選出
    <html>
    <body>
    <div class="info">
    ......
    ......
    </div>

    </body>
    </html>

    兩個(gè)div標(biāo)簽之間的內(nèi)容。
    可以用下面的方法
      $ sed -n -e '/<div>/p' -e '/<div class=\"info\">/,/<\/div>/p' *.html >  all.html


    以上方法參考自此文章http://www.fwolf.com/blog/post/346,這篇文章寫(xiě)得很好。

    以下內(nèi)容均引自上述文章。

    Update @ 2007-12-14

    在和bxy討論的過(guò)程中,又發(fā)現(xiàn)sed的另外一種用途,從html或xml中按照tag對(duì)應(yīng)關(guān)系,篩選打印出指定的tag內(nèi)容,使用了正則中的p命令,好像默認(rèn)就沒(méi)有“不能處理多行內(nèi)容”以及“貪婪性”的問(wèn)題,很好用,很強(qiáng)大:

        $ sed -n -e '/<title>/p' -e '/<text /,/<\/text>/p' from.xml

    注意/<\/text>/不在同一行的時(shí)候才好用,不然會(huì)匹配到下一個(gè)實(shí)例出現(xiàn)的位置作為結(jié)束邊界。






    |----------------------------------------------------------------------------------------|
                               版權(quán)聲明  版權(quán)所有 @zhyiwww
                引用請(qǐng)注明來(lái)源 http://m.tkk7.com/zhyiwww   
    |----------------------------------------------------------------------------------------|
    posted on 2009-10-29 18:10 zhyiwww 閱讀(8444) 評(píng)論(0)  編輯  收藏 所屬分類: linux
    主站蜘蛛池模板: 欧美男同gv免费网站观看| 免费国产人做人视频在线观看| 亚洲人成免费电影| 免费国产综合视频在线看| 国产在线观a免费观看| 亚洲视频一区在线观看| 亚洲AV综合色区无码二区爱AV| 美女被免费视频网站a国产| 国产精品无码免费专区午夜| 亚洲成a人片在线观看中文app| 国产又粗又长又硬免费视频| 午夜精品一区二区三区免费视频| 亚洲性无码一区二区三区| 亚洲人成人一区二区三区| 成人毛片18女人毛片免费视频未 | 亚洲av永久中文无码精品 | 亚洲成a人片在线不卡一二三区| 亚洲欧洲日产国码无码久久99| 美女视频黄a视频全免费| jizz免费在线观看| 麻豆狠色伊人亚洲综合网站| 亚洲精品无码不卡在线播HE| 成年人免费观看视频网站| 在线观看肉片AV网站免费| 精品国产亚洲AV麻豆| 亚洲精品中文字幕乱码影院| 亚洲午夜福利精品久久| 成人性生交大片免费看午夜a| 久久一区二区三区免费播放| 色爽黄1000部免费软件下载| 中文字幕亚洲专区| 免费无码又爽又刺激高潮的视频 | av大片在线无码免费| 爱丫爱丫影院在线观看免费| 精品视频免费在线| 亚洲av无码片区一区二区三区| 亚洲Av无码精品色午夜| 亚洲精品视频在线看| 狼友av永久网站免费观看| 91精品视频在线免费观看| 三年片免费观看大全国语|