成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

全面分析Linux正則表達式(四)

運維 系統運維
在Linux正則表達式的子模式中命名子模式(named subpattern)、一次性子模式(Once-only subpatterns)是另一部分內容,現在我們加以學習。

Linux正則表達式的子模式(subpatterns),逆向引用(Back references)上篇文章應經詳細介紹了,還有一部分內容介紹了量詞(quantifiers),量詞匹配時的greedy與ungreedy。這里加已詳細介紹。

Linux正則表達式:命名子模式(named subpattern)

一些工具(例如Python)可以為逆向引用命名,從而定義出命名子模式。在Python中對正則表達式的使用是以函數或方法調用的格式,語法與這里舉的例子有較大差別。有興趣的朋友可以參看一下自己使用的工具來看看是否支持命名子模式。
重復(Repetition)和量詞(quantifiers)
在前面介紹逆向引用的部分里我們已經接觸到了量詞(quantifiers)的概念,例如前面的例子/([abc]){3}/表示三個連續的字符,每個字符都必然是 “abc”這三個字符中的一個。在這個模式里,{3}就屬于量詞。它表示一個模式需要重復匹配(repetition)的數目。
量詞可以放在下面這些項目之后:
●單個字符(有可能是被轉義的單個字符,如xhh)
●“.”元字符
● 由方括號表示的字符類
● 逆向引用
●由小括號定義的子模式(除非它是個斷言,我們會在以后介紹)
最通用的量詞使用形式是用花括號括起的兩個由逗號分隔的數字,如這樣的格式{min,max},例如,/z{2,4}/ 可以匹配 "zz", "zzz", 或者 "zzzz",花括號中的***值以及前面的逗號可以省略,例如/d{3,}/可以匹配三個以上的數字,數字的數目沒有上限,而/d{3}/(注意,沒有逗號)則精確的匹配3個數字。當花括號出現在不允許量詞的位置或者語法與前面提到的不符時,這里它僅僅代表花括號字符本身而不再具有特殊的含義。例如{,6}不是量詞,它僅僅代表這四個字符本身的含義。
為了方便,三個最常用的量詞有它們的單字符縮寫形式,它們的的含義如下表:
* 相當于 {0,}
+ 相當于 {1,}
? 相當于 {0,1}
這也是以上三個元字符做為量詞使用含義。
在使用量詞特別是沒有上限限制的量詞時,應該特別注意不要構成無限循環,例如/(a?)*/,在有的正則表達式工具里。這會形成一個編譯錯,不過有的工具卻允許這種結構,但不能保證各種工具都可以很好的處理這種結構。
量詞匹配的“greedy”與“ungreedy”
在使用帶量詞的模式時,我們常會發現對同一模式而言,同一個目標字符串可以有多種匹配方式。例如/d{0,1}d/,可以匹配兩個或三個十進制數字,如果目標字符串是123,當量詞取下限0里,它匹配“12”,當量詞取上限1里,它匹配“123”整個字符。這兩種匹配結果都是正確的,如果我們取它的子模式/(d{0,1}d)/,則匹配的結果1到底是“12”還是“123”?
實際的運行結果一般會是后者,因為默認情況下,大多數正則表達式工具的匹配是按“greedy”原則匹配的。“greedy”單詞的中的含義是“貪吃的, 貪婪的”的意思,它的行為也如此單詞的含義,所謂greedy匹配意指在量詞限制范圍內,只要能保持后續模式的匹配,匹配總是盡可能的重復下去,直到不匹配的情況發生為止。為便于理解,我們看下面這個簡單的例子。
/(d{1,5})d/匹配“12345”這個字符串,這個模式表示在1到5個數字后面跟上一個數字,量詞范圍從1到5,當它的值在1-4時,整個模式都是匹配的,1的值可以是“1”,“12”,“123”,“1234”,而在greedy匹配的情況下,它取匹配時的量詞***值,因此最終匹配的結果是”1234”。
在大多數情況下,這就是我們想要的結果,但情況并不總這樣。例如,我們希望用下面這個模式提取出c語言的注釋部分(在c語言中,注釋語句放在字符串/*和*/之間)。我們使用的正則表達式是/*.**/,但匹配的結果卻完全和需要的不同。當正則表達式解析到“/*”這后的“.*”時,因為“.”可以代表任意字符,這也包含了其后需要匹配的“*/”,在量詞的作用下,這個匹配將一直進行下去,超過下一個“*”/直到文本的結束,這顯然不是我們需要的結果。
為了完成如上例我們想要的那種匹配,正則表達式引入了ungreedy匹配方法,與greedy匹配相反,在滿足整個模式匹配的前提下,它總是取最小的量詞數目結果。Ungreedy匹配用在量詞后面加上問號“?”來表示。例如在匹配C語言的注釋時,我們把正則表達式寫成如下形式:/*.*?*/,在量詞“*”后加上問號就可以達成想要的結果。還有前面那個例子用/(d{1,5})d/匹配“12345”這個字符串,如果改寫為ungreedy模式向這樣/(d{1,5}?)d/,、1的值將為1。
上面的解釋也許有些不準確,量詞后的問號的作用實際上是反轉當前的正則表達式的greedy與ungreedy行為。你可以通過模式修正符“U”將正則表達式設成ungreedy模式然后在模式中通過量詞后的問號將之反轉為greedy。

Linux正則表達式:一次性子模式(Once-only subpatterns)

關于量詞的另一個有趣的話題是一次性子模式(Once-only subpatterns)。要理解它的概念需要先了解一下含有量詞的正則表達式的匹配過程。我們這里舉個例子。
現在,讓我們用模式/d+foo/來匹配字符串“123456bar”,當然,它的結果是沒有匹配。但正則表達式引擎是如何工作的呢?它先分析前面的d+,這代表一個以上的數字,然后檢查目標字符串的對應位置的***個字符“1”,符合模式,然后根據量詞重復這個模式對字符串進行匹配直到“123456”始終符合“d+”模式,接著它在目標字符串中遇到字符“b”無法與“d+”匹配,于是查看“d+”的后續模式“foo”,與目標字符串的后續部分“bar”無法匹配,這時,有趣的事情出現了,解釋引擎會對前面已經解析過的“d+”模式進行回溯,將量詞數目減少一,看剩余部分能否匹配,此時“d+”的值改為“12345”,然后解釋引擎看目標字符串剩余的部分“6bar”能否與剩余的模式“foo”相匹配,如果不行,就把量詞數再減一,直到達到最小的量詞限制,如果仍無法匹配,則表明目標字符串無法匹配,返回無法匹配的結果。
現在,我們就可以來接觸一次性子模式了。所謂一次性子模式就是定義在正則表達式解析時不需要上述回溯過程的子模式。它用左圓括號后面的問號和小于號來表示,向這樣(?>)。如果將上面提到的例子改為一次性子模式,可以這樣書寫:
/(?>d)+foo/,這時,當解析器遇到后面不匹配的bar時,會立即返回不匹配的結果,而不會進行前面提到的回溯過程。
需要了解的是,一次性子模式屬于非捕獲子模式,它的匹配結果不能被逆向引用。
當一個沒有設定重復上限的子模式中包含了同樣沒有設定重復上限的模式時,使用一次性子模式是唯一可以避免讓你的程序陷入長時間等待的方法。例如你用“/(D+|<d+>)*[!?]/”這個模式去匹配一長串的a字符,向這樣“aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa”,在返回最終無匹配的結果前,你會等待很長的一段時間。這個模式表示一串非數字字符或者用尖括號括著的一串數字后跟隨著嘆號或者問號,把這段字符串分成兩個重復的部分會有很多種分法,而無論是子模式本身還是子模式之內的量詞的各可能值都要經過逐一測試,這將使最終的運算量達到一個很大的程度。這樣,你將在電腦前等待相當長的時間才會看到結果。而如果用一次性子模式來改寫剛才的模式,改成這樣/ ((?>D+)|<d+>)*[!?]/,你就可以很快得到運算的結果。

 

【編輯推薦】

  1. 全面分析Linux正則表達式(一)
  2. 詳細介紹Linux虛擬機的安裝方法
  3. 詳細剖析Linux服務器安全防護十個方面
  4. 分享一個簡單的Linux數據備份方案
  5. 怎樣處理Linux死機
責任編輯:小霞 來源: 中國網管聯盟
相關推薦

2010-03-03 11:03:51

Linux正則表達式

2010-03-03 13:31:25

Linux正則表達式

2010-03-03 10:51:32

正則表達式

2010-03-03 12:53:50

Linux正則表達式

2010-03-03 13:09:10

Linux正則表達式

2022-01-04 11:35:03

Linux Shel正則表達式Linux

2010-07-14 09:47:04

Perl正則表達式

2017-05-12 10:47:45

Linux正則表達式程序基礎

2010-07-13 16:56:30

Perl正則表達式

2020-09-04 09:16:04

Python正則表達式虛擬機

2018-09-27 15:25:08

正則表達式前端

2016-11-10 16:21:22

Java 正則表達式

2009-09-16 17:15:57

正則表達式引擎

2023-09-13 08:12:45

2024-09-14 09:18:14

Python正則表達式

2009-03-24 08:56:15

正則表達式格式清理字符串

2010-07-20 16:25:50

Perl正則表達式

2022-03-28 06:19:14

正則表達式開發

2009-02-18 09:48:20

正則表達式Java教程

2019-07-17 15:45:47

正則表達式字符串前端
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日日噜噜噜夜夜爽爽狠狠视频, | 国产精品中文字幕在线 | 亚洲视频一区在线观看 | 91香蕉视频在线观看 | 亚洲激情第一页 | 日韩不卡一区二区三区 | 国产精品五区 | 成人福利在线观看 | 欧美色综合天天久久综合精品 | 亚洲国产精品久久 | 久久51| 成人精品一区二区户外勾搭野战 | 第四色播日韩第一页 | 午夜小电影 | 亚洲欧洲成人在线 | 一级日韩 | 色综合久 | 99精品久久久久久中文字幕 | 成人在线观看中文字幕 | 欧美456| 久久久日韩精品一区二区三区 | 国产精品一区二区在线 | 免费亚洲婷婷 | 精品欧美一区免费观看α√ | 中文字幕在线第一页 | 欧美一级毛片久久99精品蜜桃 | 亚洲国产一区二区三区四区 | 91精品国产美女在线观看 | 国产在线精品一区二区 | 欧美午夜视频 | 激情影院久久 | 国产九九九九 | 久久草在线视频 | 久久久一区二区三区四区 | 欧美一区二区三区日韩 | 四虎影视免费观看 | 日韩欧美国产精品一区二区三区 | 久久久精品网站 | 伊人色综合久久天天五月婷 | a在线视频 | 国产精品五月天 |