Posted on 2008-04-10 00:18
xan 閱讀(149)
評論(0) 編輯 收藏 所屬分類:
C/C++ & MS stuff
regexp很好很強大,不過一時半會沒時間看,不過總是要看的,先從.net用到的開始吧~
從網(wǎng)頁源碼中分析出 類似于 href=["|'] www.cc98.org/shop/index.asp["|'] 的東西
string pattern = "<a[^><]* href [\\s]* = [\\s]* ["|']? (?<urltext>([^\"'><\\s]+)) ["|']? [^>]* >"
Regex=new Regex(pattern,...)
請無視空格,沒有任何含義,只是方便閱讀.
以<a >為界, 我覺得應(yīng)該要有明確的界,才能保證匹配速度.
VS的幫助文檔中有這些內(nèi)容,花個2小時靜心看看,便知了