亚洲第一男人天堂,一本色道久久综合亚洲精品蜜桃冫,亚洲日本天堂在线

一、概述

正則表達(dá)式是Java處理字符串、文本的重要工具。

Java對正則表達(dá)式的處理集中在以下兩個(gè)兩個(gè)類：

java.util.regex.Matcher 模式類：用來表示一個(gè)編譯過的正則表達(dá)式。

java.util.regex.Pattern 匹配類：用模式匹配一個(gè)字符串所表達(dá)的抽象結(jié)果。

（很遺憾，Java Doc并沒有給出這兩個(gè)類的職責(zé)概念。）

比如一個(gè)簡單例子：

import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
* 正則表達(dá)式例子
*
* @author leizhimin 2009-7-17 9:02:53
*/
public class TestRegx {
        public static void main(String[] args) {
                Pattern p = Pattern.compile("f(.+?)k");
                Matcher m = p.matcher("fckfkkfkf");
                while (m.find()) {
                        String s0 = m.group();
                        String s1 = m.group(1);
                        System.out.println(s0 + "||" + s1);
                }
                System.out.println("---------");
                m.reset("fucking!");
                while (m.find()) {
                        System.out.println(m.group());
                }

                Pattern p1 = Pattern.compile("f(.+?)i(.+?)h");
                Matcher m1 = p1.matcher("finishabigfishfrish");
                while (m1.find()) {
                        String s0 = m1.group();
                        String s1 = m1.group(1);
                        String s2 = m1.group(2);
                        System.out.println(s0 + "||" + s1 + "||" + s2);
                }

                System.out.println("---------");
                Pattern p3 = Pattern.compile("(19|20)\\d\\d([- /.])(0[1-9]|1[012])\\2(0[1-9]|[12][0-9]|3[01])");
                Matcher m3 = p3.matcher("1900-01-01 2007/08/13 1900.01.01 1900 01 01 1900-01.01 1900 13 01 1900 02 31");
                while (m3.find()) {
                        System.out.println(m3.group());
                }
        }
}

輸出結(jié)果：

fck||c
fkk||k
---------
fuck
finish||in||s
fishfrish||ishfr||s
---------
1900-01-01
2007/08/13
1900.01.01
1900 01 01
1900 02 31

Process finished with exit code 0

二、一些容易迷糊的問題

1、Java對反斜線處理的問題

在其他語言中，\\表示要插入一個(gè)字符\;

在Java語言中，\\表示要插入正則表達(dá)式的反斜線，并且后面的字符有特殊意義。

看API文檔：

預(yù)定義字符類

. 任何字符（與行結(jié)束符可能匹配也可能不匹配）

\d 數(shù)字：[0-9]

\D 非數(shù)字： [^0-9]

\s 空白字符：[ \t\n\x0B\f\r]

\S 非空白字符：[^\s]

\w 單詞字符：[a-zA-Z_0-9]

\W 非單詞字符：[^\w]

但是看看上面程序，對比下不難看出：

\d在實(shí)際使用的時(shí)候就寫成了 \\d;

在Java正則表達(dá)式中，如果要插入一個(gè)\字符，則需要在正則表達(dá)式中寫成\\\\，原因是下面的APIDoc定義\\表示一個(gè)反斜線。

但是如果在正則表示式中表示回車換行等，則不需要多添加反斜線了。比如回車\r就寫作\r.

字符

x 字符 x

\\ 反斜線字符

\0n 帶有八進(jìn)制值 0 的字符 n (0 <= n <= 7)

\0nn 帶有八進(jìn)制值 0 的字符 nn (0 <= n <= 7)

\0mnn 帶有八進(jìn)制值 0 的字符 mnn（0 <= m <= 3、0 <= n <= 7）

\xhh 帶有十六進(jìn)制值 0x 的字符 hh

\uhhhh 帶有十六進(jìn)制值 0x 的字符 hhhh

\t 制表符 ('\u0009')

\n 新行（換行）符 ('\u000A')

\r 回車符 ('\u000D')

\f 換頁符 ('\u000C')

\a 報(bào)警 (bell) 符 ('\u0007')

\e 轉(zhuǎn)義符 ('\u001B')

\cx 對應(yīng)于 x 的控制符

2、Matcher.find()：嘗試查找與模式匹配的字符序列的下一個(gè)子序列。此方法從字符序列的開頭開始，如果該方法的前一次調(diào)用成功了并且從那時(shí)開始匹配器沒有被重置，則從以前匹配操作沒有匹配的第一個(gè)字符開始，即如果前一次找到與模式匹配的子序列則這次從這個(gè)子序列后開始查找。

3、Matcher.matchers()：判斷整個(gè)字符序列與模式是否匹配。當(dāng)連續(xù)用Matcher對象檢查多個(gè)字符串時(shí)候，可以使用

Matcher.reset()：重置匹配器，放棄其所有顯式狀態(tài)信息并將其添加位置設(shè)置為零。

或者M(jìn)atcher.reset(CharSequence input) 重置此具有新輸入序列的匹配器。

來重復(fù)使用匹配器。

4、組的概念，這個(gè)概念很重要，組是用括號劃分的正則表達(dá)式，可以通過編號來引用組。組號從0開始，有幾對小括號就表示有幾個(gè)組，并且組可以嵌套，組號為0的表示整個(gè)表達(dá)式，組號為1的表示第一個(gè)組，依此類推.

例如：A(B)C(D)E正則式中有三組，組0是ABCDE，組1是B，組2是D；

A((B)C)(D)E正則式中有四組：組0是ABCDE，組1是BC，組2是B；組3是C，組4是D。

int groupCount()：返回匹配其模式中組的數(shù)目，不包括第0組。

String group()：返回前一次匹配操作（如find()）的第0組。

String group(int group)：返回前一次匹配操作期間指定的組所匹配的子序列。如果該匹配成功，但指定組未能匹配字符序列的任何部分，則返回 null。

int start(int group)：返回前一次匹配操作期間指定的組所匹配的子序列的初始索引。

int end(int group)：返回前一次匹配操作期間指定的組所匹配的子序列的最后索引+1。

5、匹配的范圍的控制

最變態(tài)的就要算lookingAt()方法了，名字很讓人迷惑，需要認(rèn)真看APIDoc。

start() 返回以前匹配的初始索引。

end() 返回最后匹配字符之后的偏移量。

public boolean lookingAt()嘗試將從區(qū)域開頭開始的輸入序列與該模式匹配。

與 matches 方法類似，此方法始終從區(qū)域的開頭開始；與之不同的是，它不需要匹配整個(gè)區(qū)域。

如果匹配成功，則可以通過 start、end 和 group 方法獲取更多信息。

當(dāng)且僅當(dāng)輸入序列的前綴匹配此匹配器的模式時(shí)才返回 true。

6、Pattern標(biāo)記

Pattern類的靜態(tài)方法

static Pattern compile(String regex, int flags)

將給定的正則表達(dá)式編譯到具有給定標(biāo)志的模式中。

其中的flags參數(shù)就是Pattern標(biāo)記，這個(gè)標(biāo)記在某些時(shí)候非常重要。

Pattern.CANON_EQ

啟用規(guī)范等價(jià)。

Pattern.CASE_INSENSITIVE

啟用不區(qū)分大小寫的匹配。

Pattern.COMMENTS

模式中允許空白和注釋。

Pattern.DOTALL

啟用 dotall 模式。

Pattern.LITERAL

啟用模式的字面值分析。

Pattern.MULTILINE

啟用多行模式。

Pattern.UNICODE_CASE

啟用 Unicode 感知的大小寫折疊。

Pattern.UNIX_LINES

啟用 Unix 行模式。

三、字符串的替換

String.replace(char oldChar, char newChar)

返回一個(gè)新的字符串，它是通過用 newChar 替換此字符串中出現(xiàn)的所有 oldChar 而生成的。

String.replace(CharSequence target, CharSequence replacement)

使用指定的字面值替換序列替換此字符串匹配字面值目標(biāo)序列的每個(gè)子字符串。

String.replaceAll(String regex, String replacement)

使用給定的 replacement 字符串替換此字符串匹配給定的正則表達(dá)式的每個(gè)子字符串。

String.replaceFirst(String regex, String replacement)

使用給定的 replacement 字符串替換此字符串匹配給定的正則表達(dá)式的第一個(gè)子字符串。

StringBuffer.replace(int start, int end, String str)

使用給定 String 中的字符替換此序列的子字符串中的字符。

StringBuilder.replace(int, int, java.lang.String)

使用給定 String 中的字符替換此序列的子字符串中的字符。

Matcher.replaceAll(String replacement)

替換模式與給定替換字符串相匹配的輸入序列的每個(gè)子序列。

Matcher.replaceFirst(String replacement)

替換模式與給定替換字符串匹配的輸入序列的第一個(gè)子序列。

四、字符串的切分

String[] split(String regex)

根據(jù)給定的正則表達(dá)式的匹配來拆分此字符串。

String[] split(String regex, int limit)

根據(jù)匹配給定的正則表達(dá)式來拆分此字符串。

當(dāng)然，還有一個(gè)StringTokenizer類，可以用來切分字符串，但是現(xiàn)在SUN已經(jīng)不推薦使用了。

轉(zhuǎn)變下思路，其實(shí)用正則表達(dá)式也可以達(dá)到將字符串切分為段的目的。

五、沒有提到的

正則表達(dá)式的API簡單好用，沒太多復(fù)雜的地方，并非不重要，正則表達(dá)式最大的難點(diǎn)在于熟練書寫正則表達(dá)式。

有關(guān)正則表達(dá)式的規(guī)范，在Pattern類APIdoc中都有非常詳細(xì)的介紹，而且條理清晰，在此就不贅述了。

posted on 2009-10-17 11:16 Werther 閱讀(602) 評論(0) 編輯收藏所屬分類: 10.Java

I'm reading...

寶貝連接

留言簿(10)

隨筆分類(178)

隨筆檔案(208)

文章檔案(1)

新聞檔案(6)

相冊

1.Java Official Website

2.Java Study Website

3.Java Technic Website

4.Java Video Website

5.Database Website

6.Bookshop Website

7.English Website

8.Friends Link

9.Other Web

積分與排名

最新評論

閱讀排行榜

評論排行榜


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關(guān)文章: Java中的四個(gè)核心技術(shù)思想淺析jQuery框架與構(gòu)造對象 java中set map list的區(qū)別使用Java操作JSON字符串對象 Eclipse插件開發(fā)之FindBugs插件 Eclipse中配置Ajax的DWR的簡單方法 Java Excel API 使用方法 Java生成UUID通用唯一識別碼 instanceof 運(yùn)算符的用法不同方式遍歷Map集合