淺談Java正則表達式中的Pattern類與Matcher類
Pattern類說明
指定為字符串的Java正則表達式必須首先被編譯為pattern類的實例。然后,可將得到的模式用于創建 Matcher 對象,依照Java正則表達式,該對象可以與任意字符序列匹配。執行匹配所涉及的所有狀態都駐留在匹配器中,所以多個匹配器可以共享同一模式。
因此,典型的調用順序是
- Pattern p = Pattern.compile("a*b");
- Matcher m = p.matcher("aaaaab");
- boolean b = m.matches();
在僅使用一次正則表達式時,可以方便地通過pattern類定義 matches 方法。此方法編譯表達式并在單個
調用中將輸入序列與其匹配。語句
boolean b = Pattern.matches("a*b", "aaaaab");
等效于上面的三個語句,盡管對于重復的匹配而言它效率不高,因為它不允許重用已編譯的模式。
此類的實例是不可變的,可供多個并發線程安全使用。Matcher 類的實例用于此目的則不安全。
Matcher類說明
通過調用模式的 matcher 方法從模式創建匹配器。創建匹配器后,可以使用它執行三種不同的匹配操作:
1 matches 方法嘗試將整個輸入序列與該模式匹配。
(注:當調用String的matches()方法時,實際上是調用Pattern的靜態方法matches().也就是相當于調Matcher的matches(),所以是整個輸入序列與模式匹配.)
2 lookingAt 嘗試將輸入序列從頭開始與該模式匹配。
3 find 方法掃描輸入序列以查找與該模式匹配的下一個子序列。
此類的實例用于多個并發線程是不安全的。
測試代碼
package test;
- import java.util.regex.Matcher;
- import java.util.regex.Pattern;
- /**
- * java中運用正則表達式的兩個重要類:Pattern與Matcher
- * @author fhd001
- */
- public class PatternAndMatcherTest {
- public static void main(String[] args) {
- /*
- * 常用的調用
- */
- Pattern p1 = Pattern.compile("a*b");
- String str1 = "aaaab";
- Matcher m1 = p1.matcher(str1);
- boolean b1 = m1.matches();
- System.out.println(b1);
- String str2 = "b";
- Matcher m2 = p1.matcher(str2);
- boolean b2 = m2.matches();
- System.out.println(b2);
- /*
- * 另一種調用
- * 等效于上面的語句,盡管對于重復的匹配而言它效率不高,因為它不允許重用已編譯的模式。
- * 但它可供多個并發線程安全使用,而上面的調用則就不是安全的.
- */
- boolean b3 = Pattern.matches("a*b", "aaab");
- System.out.println(b3);
- //Pattern類的pattern方法:從pattern類的實例中返回匹配模式的字符串表示
- String pattern1 = p1.pattern();
- System.out.println(pattern1);
- //Pattern類的split方法
- String[]arr1 = p1.split("rrrrraaabccccaaaaab");
- for (String string : arr1) {
- System.out.println(string+">>>>");
- }
- /*
- * Matcher類
- *
- * matches方法: 方法嘗試將整個輸入序列與該模式匹配
- * lookingAt方法: 嘗試將輸入序列從頭開始與該模式匹配,與 matches 方法類似,
- * 此方法始終從區域的開頭開始;與之不同的是,它不需要匹配整個區域。
- * find方法: 方法掃描輸入序列以查找與該模式匹配的下一個子序列
- */
- String str3 = "aabbcccaaaaaeeeaaaaaaaaagggga";
- Pattern p3 = Pattern.compile("a+");
- Matcher m3 = p3.matcher(str3);
- boolean bo4 = m3.matches();
- System.out.println("matches方法: "+bo4);
- /*
- * lookingAt方法,從開頭***個字符進行匹配,匹配成功了不再繼續匹配,
- * 從***個字符開始,匹配失敗了,也不繼續匹配.不需要匹配整個序列
- */
- boolean bo5 = m3.lookingAt();
- if(bo5){
- //group方法(不帶參數)返回的就是匹配的子字符串.
- System.out.println("lookingAt方法: "+m3.group());
- }
- //find方法:找到一個匹配的子串,還會繼續找下一個子串.
- while(m3.find()){
- System.out.println("find方法: "+m3.group());
- }
- /*
- * 帶參數的group方法與不帶參數的group方法區別
- * 不帶參數的group方法:find方法與lookingAt方法匹配出來的子序列(上面有演示)
- * 帶參數的group方法: 返回在以前匹配操作期間由給定組捕獲的輸入子序列。
- */
- String str6 = "aaabbbccc";
- Pattern p5 = Pattern.compile("(a+)(b+)(c+)");
- Matcher m5 = p5.matcher(str6);
- boolean boo = m5.matches();
- if(boo){
- int k = m5.groupCount()+1;//加1就是把0下標的整個字符序列加上,它也作為一組放在0下標的位置.
- if(k>0){
- for(int i=0;i System.out.println(m5.group(i));
- }
- }
- }
- }
- }
- package test;
- import java.util.regex.Matcher;
- import java.util.regex.Pattern;
- /**
- * java中運用正則表達式的兩個重要類:Pattern與Matcher
- * @author fhd001
- */
- public class PatternAndMatcherTest {
- public static void main(String[] args) {
- /*
- * 常用的調用
- */
- Pattern p1 = Pattern.compile("a*b");
- String str1 = "aaaab";
- Matcher m1 = p1.matcher(str1);
- boolean b1 = m1.matches();
- System.out.println(b1);
- String str2 = "b";
- Matcher m2 = p1.matcher(str2);
- boolean b2 = m2.matches();
- System.out.println(b2);
- /*
- * 另一種調用
- * 等效于上面的語句,盡管對于重復的匹配而言它效率不高,因為它不允許重用已編譯的模式。
- * 但它可供多個并發線程安全使用,而上面的調用則就不是安全的.
- */
- boolean b3 = Pattern.matches("a*b", "aaab");
- System.out.println(b3);
- //Pattern類的pattern方法:從pattern類的實例中返回匹配模式的字符串表示
- String pattern1 = p1.pattern();
- System.out.println(pattern1);
- //Pattern類的split方法
- String[]arr1 = p1.split("rrrrraaabccccaaaaab");
- for (String string : arr1) {
- System.out.println(string+">>>>");
- }
- /*
- * Matcher類
- *
- * matches方法: 方法嘗試將整個輸入序列與該模式匹配
- * lookingAt方法: 嘗試將輸入序列從頭開始與該模式匹配,與 matches 方法類似,
- * 此方法始終從區域的開頭開始;與之不同的是,它不需要匹配整個區域。
- * find方法: 方法掃描輸入序列以查找與該模式匹配的下一個子序列
- */
- String str3 = "aabbcccaaaaaeeeaaaaaaaaagggga";
- Pattern p3 = Pattern.compile("a+");
- Matcher m3 = p3.matcher(str3);
- boolean bo4 = m3.matches();
- System.out.println("matches方法: "+bo4);
- /*
- * lookingAt方法,從開頭***個字符進行匹配,匹配成功了不再繼續匹配,
- * 從***個字符開始,匹配失敗了,也不繼續匹配.不需要匹配整個序列
- */
- boolean bo5 = m3.lookingAt();
- if(bo5){
- //group方法(不帶參數)返回的就是匹配的子字符串.
- System.out.println("lookingAt方法: "+m3.group());
- }
- //find方法:找到一個匹配的子串,還會繼續找下一個子串.
- while(m3.find()){
- System.out.println("find方法: "+m3.group());
- }
- /*
- * 帶參數的group方法與不帶參數的group方法區別
- * 不帶參數的group方法:find方法與lookingAt方法匹配出來的子序列(上面有演示)
- * 帶參數的group方法: 返回在以前匹配操作期間由給定組捕獲的輸入子序列。
- */
- String str6 = "aaabbbccc";
- Pattern p5 = Pattern.compile("(a+)(b+)(c+)");
- Matcher m5 = p5.matcher(str6);
- boolean boo = m5.matches();
- if(boo){
- int k = m5.groupCount()+1;//加1就是把0下標的整個字符序列加上,它也作為一組放在0下標的位置.
- if(k>0){
- for(int i=0;i System.out.println(m5.group(i));
- }
- }
- }
- }
- }
結果代碼
- true
- true
- true
- a*b
- rrrrr>>>>
- cccc>>>>
- matches方法: false
- lookingAt方法: aa
- find方法: aaaaa
- find方法: aaaaaaaaa
- find方法: a
- aaabbbccc
- aaa
- bbb
- ccc
【編輯推薦】