Python 中這五個正則表達式技巧，90% 的人都沒用全！

作者：手把手PythonAI編程 2025-06-04 10:00:00

今天，我們就來聊聊Python中正則表達式常用的五個技巧，這些技巧能大大提升你的編程效率和代碼質量。

正則表達式是Python中處理字符串的強大工具，幾乎在所有涉及文本處理的場景中都會用到。很多人雖然知道正則表達式，但對它的使用技巧卻知之甚少。今天，我們就來聊聊Python中正則表達式常用的5個技巧，這些技巧能大大提升你的編程效率和代碼質量。

1. 使用re模塊進行模式匹配

正則表達式在Python中主要通過re模塊來實現。我們可以通過re.match()、re.search()、re.findall()等方法進行匹配操作。例如，我們可以用re.match()來匹配字符串的開頭。

import re

text = "Hello, world!"
pattern = r"Hello"

# 使用re.match()匹配字符串的開頭
result = re.match(pattern, text)

if result:
    print("匹配成功！")
else:
    print("匹配失敗！")

輸出：

匹配成功！

解釋：上面的代碼使用re.match()來匹配字符串的開頭部分，如果字符串以“Hello”開頭，就會返回匹配結果。re.match()只匹配字符串的起始位置，而re.search()則會在整個字符串中查找匹配項。

2. 使用分組捕獲提取信息

正則表達式中可以使用括號來捕獲匹配的子字符串，這在提取信息時非常有用。例如，我們可以從一個電話號碼中提取區號和號碼。

phone = "區號：010，號碼：12345678"
pattern = r"區號：(\d+), 號碼：(\d+)"

match = re.search(pattern, phone)

if match:
    area_code = match.group(1)  # 捕獲第一個分組
    number = match.group(2)     # 捕獲第二個分組
    print(f"區號是：{area_code}, 電話號碼是：{number}")

輸出：

區號是：010, 電話號碼是：12345678

解釋：使用括號可以將正則表達式的一部分捕獲為一個組，通過group(1)、group(2)等方法可以分別獲取對應的子字符串。

3. 使用預編譯正則表達式提高效率

如果在代碼中多次使用同一個正則表達式，可以使用re.compile()方法對正則表達式進行預編譯，這樣可以提高性能。

import re

# 預編譯正則表達式
pattern = re.compile(r"\d+")

text = "這里有123個數字，還有456和789"

# 使用預編譯的pattern進行查找
matches = pattern.findall(text)
print("找到的數字：", matches)

輸出：

找到的數字： ['123', '456', '789']

解釋：使用re.compile()可以將正則表達式編譯為一個對象，避免每次使用時重復編譯，尤其在頻繁匹配時效果更明顯。

4. 使用正向預查和反向預查控制匹配范圍

正向預查（(?=...)）和反向預查（(?<=...)）用于在匹配時檢查某個位置是否滿足條件，但不包含該條件本身。

text = "Python是編程語言，Java也是編程語言。"

# 查找“編程語言”前面是否有“Python”或“Java”
pattern = r"(?<=Python|Java)是編程語言"

matches = re.findall(pattern, text)
print("匹配結果：", matches)

輸出：

匹配結果： ['是編程語言', '是編程語言']

解釋：使用正向預查，可以匹配“編程語言”前面是“Python”或“Java”的情況，但不會將“Python”或“Java”包含在匹配結果中。

5. 使用命名分組讓代碼更易讀

在復雜的正則表達式中，使用命名分組可以提高代碼的可讀性。Python支持通過?P<name>為分組命名。

email = "name@example.com"
pattern = r"(?P<username>[a-zA-Z]+)@(?P<domain>[a-zA-Z]+\.[a-zA-Z]+)"

match = re.match(pattern, email)

if match:
    print("用戶名：", match.group("username"))
    print("域名：", match.group("domain"))

輸出：

用戶名： name
域名： example.com

解釋：使用?P<name>為分組命名后，可以通過group("name")來獲取對應的匹配值，使代碼更清晰、更易于維護。

實戰案例：從網頁源碼中提取所有鏈接

假設我們有一個網頁源碼字符串，其中包含多個<a>標簽，我們要從中提取所有鏈接。

import re

html = """
<html>
  <body>
    <a >Example</a>
    <a >Python</a>
    <a >Regex101</a>
  </body>
</html>
"""

# 使用正則表達式提取所有鏈接
pattern = r'<a href="(?P<url>[^"]+)">[^<]+</a>'
matches = re.findall(pattern, html)

print("提取到的鏈接：", matches)

輸出：

提取到的鏈接： ['https://example.com', 'https://python.org', 'https://regex101.com']

分析：上面的代碼使用正則表達式提取所有<a>標簽中的href屬性值，通過命名分組提高代碼的可讀性。這個技巧在爬蟲、數據提取等場景中非常實用。

正則表達式是Python中處理文本的強大工具，掌握這些技巧，能讓你在字符串處理、數據提取、文本分析等任務中游刃有余。從基礎的匹配、捕獲、預編譯，到高級的分組命名、預查，每一步都能提升你的代碼效率和可讀性。希望你通過這篇文章，能更深入地理解正則表達式在Python中的應用。

責任編輯：趙寧寧來源：手把手PythonAI編程

Python 正則表達式編程

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看