<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-199  評論-203  文章-11  trackbacks-0
     
    一、概述
    正則表達式是Java處理字符串、文本的重要工具。
    Java對正則表達式的處理集中在以下兩個兩個類:
    java.util.regex.Matcher   模式類:用來表示一個編譯過的正則表達式。
    java.util.regex.Pattern   匹配類:用模式匹配一個字符串所表達的抽象結果。
    (很遺憾,Java Doc并沒有給出這兩個類的職責概念。)
     
    比如一個簡單例子:
    import java.util.regex.Matcher; 
    import java.util.regex.Pattern; 

    /** 
    * 正則表達式例子 
    * 
    * @author leizhimin 2009-7-17 9:02:53 
    */
     
    public class TestRegx { 
            public static void main(String[] args) { 
                    Pattern p = Pattern.compile("f(.+?)k"); 
                    Matcher m = p.matcher("fckfkkfkf"); 
                    while (m.find()) { 
                            String s0 = m.group(); 
                            String s1 = m.group(1); 
                            System.out.println(s0 + "||" + s1); 
                    } 
                    System.out.println("---------"); 
                    m.reset("fucking!"); 
                    while (m.find()) { 
                            System.out.println(m.group()); 
                    } 

                    Pattern p1 = Pattern.compile("f(.+?)i(.+?)h"); 
                    Matcher m1 = p1.matcher("finishabigfishfrish"); 
                    while (m1.find()) { 
                            String s0 = m1.group(); 
                            String s1 = m1.group(1); 
                            String s2 = m1.group(2); 
                            System.out.println(s0 + "||" + s1 + "||" + s2); 
                    } 

                    System.out.println("---------"); 
                    Pattern p3 = Pattern.compile("(19|20)\\d\\d([- /.])(0[1-9]|1[012])\\2(0[1-9]|[12][0-9]|3[01])"); 
                    Matcher m3 = p3.matcher("1900-01-01 2007/08/13 1900.01.01 1900 01 01 1900-01.01 1900 13 01 1900 02 31"); 
                    while (m3.find()) { 
                            System.out.println(m3.group()); 
                    } 
            } 
    }
     
    輸出結果:
    fck||c 
    fkk||k 
    --------- 
    fuck 
    finish||in||s 
    fishfrish||ishfr||s 
    --------- 
    1900-01-01 
    2007/08/13 
    1900.01.01 
    1900 01 01 
    1900 02 31 

    Process finished with exit code 0
     
    二、一些容易迷糊的問題
     
    1、Java對反斜線處理的問題
     
    在其他語言中,\\表示要插入一個字符\;
    在Java語言中,\\表示要插入正則表達式的反斜線,并且后面的字符有特殊意義。
     
    看API文檔:
    預定義字符類
    . 任何字符(與行結束符可能匹配也可能不匹配)
    \d 數字:[0-9]
    \D 非數字: [^0-9]
    \s 空白字符:[ \t\n\x0B\f\r]
    \S 非空白字符:[^\s]
    \w 單詞字符:[a-zA-Z_0-9]
    \W 非單詞字符:[^\w]
     
    但是看看上面程序,對比下不難看出:
    \d在實際使用的時候就寫成了 \\d;
     
     
    在Java正則表達式中,如果要插入一個\字符,則需要在正則表達式中寫成\\\\,原因是下面的APIDoc定義\\表示一個反斜線。
    但是如果在正則表示式中表示回車換行等,則不需要多添加反斜線了。比如回車\r就寫作\r.
     
    字符
    x 字符 x
    \\ 反斜線字符
    \0n 帶有八進制值 0 的字符 n (0 <= n <= 7)
    \0nn 帶有八進制值 0 的字符 nn (0 <= n <= 7)
    \0mnn 帶有八進制值 0 的字符 mnn(0 <= m <= 3、0 <= n <= 7)
    \xhh 帶有十六進制值 0x 的字符 hh
    \uhhhh 帶有十六進制值 0x 的字符 hhhh
    \t 制表符 ('\u0009')
    \n 新行(換行)符 ('\u000A')
    \r 回車符 ('\u000D')
    \f 換頁符 ('\u000C')
    \a 報警 (bell) 符 ('\u0007')
    \e 轉義符 ('\u001B')
    \cx 對應于 x 的控制符
     
    2、Matcher.find():嘗試查找與模式匹配的字符序列的下一個子序列。此方法從字符序列的開頭開始,如果該方法的前一次調用成功了并且從那時開始匹配器沒有被重置,則從以前匹配操作沒有匹配的第一個字符開始,即如果前一次找到與模式匹配的子序列則這次從這個子序列后開始查找。
     
    3、Matcher.matchers():判斷整個字符序列與模式是否匹配。當連續用Matcher對象檢查多個字符串時候,可以使用
    Matcher.reset():重置匹配器,放棄其所有顯式狀態信息并將其添加位置設置為零。
    或者Matcher.reset(CharSequence input)  重置此具有新輸入序列的匹配器。
    來重復使用匹配器。
     
    4、組的概念,這個概念很重要,組是用括號劃分的正則表達式,可以通過編號來引用組。組號從0開始,有幾對小括號就表示有幾個組,并且組可以嵌套,組號為0的表示整個表達式,組號為1的表示第一個組,依此類推.
    例如:A(B)C(D)E正則式中有三組,組0是ABCDE,組1是B,組2是D;
    A((B)C)(D)E正則式中有四組:組0是ABCDE,組1是BC,組2是B;組3是C,組4是D。
     
    int groupCount():返回匹配其模式中組的數目,不包括第0組。
    String group():返回前一次匹配操作(如find())的第0組。
    String group(int group):返回前一次匹配操作期間指定的組所匹配的子序列。如果該匹配成功,但指定組未能匹配字符序列的任何部分,則返回 null。
    int start(int group):返回前一次匹配操作期間指定的組所匹配的子序列的初始索引。
    int end(int group):返回前一次匹配操作期間指定的組所匹配的子序列的最后索引+1。
     
    5、匹配的范圍的控制
    最變態的就要算lookingAt()方法了,名字很讓人迷惑,需要認真看APIDoc。
     
    start()  返回以前匹配的初始索引。
    end()  返回最后匹配字符之后的偏移量。
     
    public boolean lookingAt()嘗試將從區域開頭開始的輸入序列與該模式匹配。
    與 matches 方法類似,此方法始終從區域的開頭開始;與之不同的是,它不需要匹配整個區域。
    如果匹配成功,則可以通過 start、end 和 group 方法獲取更多信息。
    返回:
    當且僅當輸入序列的前綴匹配此匹配器的模式時才返回 true。
     
    6、Pattern標記
     
    Pattern類的靜態方法
    static Pattern compile(String regex, int flags)
              將給定的正則表達式編譯到具有給定標志的模式中。
    其中的flags參數就是Pattern標記,這個標記在某些時候非常重要。
     
    Pattern.CANON_EQ
              啟用規范等價。
    Pattern.CASE_INSENSITIVE
              啟用不區分大小寫的匹配。
    Pattern.COMMENTS
              模式中允許空白和注釋。
    Pattern.DOTALL
              啟用 dotall 模式。
    Pattern.LITERAL
              啟用模式的字面值分析。
    Pattern.MULTILINE
              啟用多行模式。
    Pattern.UNICODE_CASE
              啟用 Unicode 感知的大小寫折疊。
    Pattern.UNIX_LINES
              啟用 Unix 行模式。
     
    三、字符串的替換
     
    String.replace(char oldChar, char newChar)
              返回一個新的字符串,它是通過用 newChar 替換此字符串中出現的所有 oldChar 而生成的。
    String.replace(CharSequence target, CharSequence replacement)
              使用指定的字面值替換序列替換此字符串匹配字面值目標序列的每個子字符串。
    String.replaceAll(String regex, String replacement)
              使用給定的 replacement 字符串替換此字符串匹配給定的正則表達式的每個子字符串。
    String.replaceFirst(String regex, String replacement)
              使用給定的 replacement 字符串替換此字符串匹配給定的正則表達式的第一個子字符串。
     
    StringBuffer.replace(int start, int end, String str)
              使用給定 String 中的字符替換此序列的子字符串中的字符。
    StringBuilder.replace(int, int, java.lang.String)
              使用給定 String 中的字符替換此序列的子字符串中的字符。
     
    Matcher.replaceAll(String replacement)
              替換模式與給定替換字符串相匹配的輸入序列的每個子序列。
    Matcher.replaceFirst(String replacement)
              替換模式與給定替換字符串匹配的輸入序列的第一個子序列。
     
    四、字符串的切分
     
     String[] split(String regex)
              根據給定的正則表達式的匹配來拆分此字符串。
     String[] split(String regex, int limit)
              根據匹配給定的正則表達式來拆分此字符串。
      
    當然,還有一個StringTokenizer類,可以用來切分字符串,但是現在SUN已經不推薦使用了。
    轉變下思路,其實用正則表達式也可以達到將字符串切分為段的目的。
     
    五、沒有提到的
     
    正則表達式的API簡單好用,沒太多復雜的地方,并非不重要,正則表達式最大的難點在于熟練書寫正則表達式。
    有關正則表達式的規范,在Pattern類APIdoc中都有非常詳細的介紹,而且條理清晰,在此就不贅述了。
    posted on 2009-10-17 11:16 Werther 閱讀(602) 評論(0)  編輯  收藏 所屬分類: 10.Java
    主站蜘蛛池模板: 亚洲国产精品无码专区| 亚洲xxxx视频| 91免费资源网站入口| 爱爱帝国亚洲一区二区三区| 亚洲午夜精品第一区二区8050| 久久国产乱子免费精品| 亚洲性色精品一区二区在线| 国产精品亚洲玖玖玖在线观看| 18女人腿打开无遮掩免费| 国产亚洲一卡2卡3卡4卡新区| 亚洲精品成人无码中文毛片不卡| 精品无码人妻一区二区免费蜜桃| 亚洲欧美aⅴ在线资源| 国产aⅴ无码专区亚洲av| 成全高清视频免费观看| a级在线免费观看| 亚洲乱码av中文一区二区| 亚洲αv在线精品糸列| 四虎成人免费影院网址| 久久精品免费电影| 污污免费在线观看| 亚洲日产2021三区| 亚洲综合av永久无码精品一区二区| 四虎永久在线精品免费观看视频 | 国产综合激情在线亚洲第一页| 亚洲五月综合缴情在线观看| 蜜桃视频在线观看免费网址入口 | 免费一本色道久久一区| 免费萌白酱国产一区二区三区| 亚洲乱色伦图片区小说| 亚洲精品在线播放视频| 亚洲小说区图片区另类春色| 国产真实伦在线视频免费观看| 69xx免费观看视频| 国产午夜无码精品免费看动漫| 猫咪www免费人成网站| 亚洲综合国产成人丁香五月激情| 亚洲另类激情综合偷自拍| 国产亚洲精品无码拍拍拍色欲| 国产青草视频在线观看免费影院| h在线观看视频免费网站|