PYTHON REGEX
CÁC CHỦ ĐỀ
BÀI MỚI NHẤT
MỚI CẬP NHẬT

Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.

Nhóm Non-capturing trong Regex Python

Trong bài viết này, bạn sẽ tìm hiểu cách sử dụng nhóm non-capturing trong regex của Python. Đây là một công cụ mạnh mẽ giúp tạo ra các nhóm trong biểu thức chính quy mà không cần lưu trữ chúng trong kết quả khớp, giúp tiết kiệm bộ nhớ và tối ưu hóa hiệu suất. Nhóm non-capturing cung cấp sự linh hoạt trong việc tạo các mẫu regex phức tạp mà không làm tăng chi phí lưu trữ không cần thiết.

test php

banquyen png
Bài viết này được đăng tại freetuts.net, không được copy dưới mọi hình thức.

Giới thiệu về nhóm non-capturing trong regex Python

Regular expressions có hai loại nhóm:

  • Nhóm capturing
  • Nhóm non-capturing

Bạn đã học cách sử dụng nhóm bắt để trích xuất thông tin từ một kết quả khớp lớn hơn hoặc khớp lại nhóm đã khớp trước đó bằng cách sử dụng backreference.

Để tạo nhóm bắt, bạn đặt một mẫu (hoặc quy tắc) bên trong dấu ngoặc đơn, ví dụ:

Bài viết này được đăng tại [free tuts .net]

(X)

Cú pháp này sẽ bắt bất cứ thứ gì khớp với X bên trong kết quả khớp để bạn có thể truy cập nó thông qua phương thức group() của đối tượng Match.

Đôi khi, bạn có thể muốn tạo một nhóm nhưng không muốn lưu trữ nó trong các nhóm của kết quả khớp. Để làm điều đó, bạn có thể sử dụng nhóm non-capturing với cú pháp sau:

(?:X)

Ví dụ về nhóm non-capturing trong Regex Python

Ví dụ sau minh họa cách sử dụng các nhóm bắt để bắt phiên bản chính và phụ của Python trong chuỗi "Python 3.10":

import re

s = 'Python 3.10'
pattern = '(\d+)\.(\d+)'

match = re.search(pattern, s)

# hiển thị kết quả khớp toàn bộ
print(match.group())

# hiển thị các nhóm
for group in match.groups():
    print(group)

Kết quả:

3.10
3
10

Mẫu sau khớp một hoặc nhiều chữ số theo sau bởi ký tự "." và một hoặc nhiều chữ số:

(\d+)\.(\d+)

Nó có hai nhóm bắt. Chúng bắt các chữ số trước và sau ký tự ".":

3
10

Giả sử bạn không muốn bắt các chữ số trước ký tự ".", bạn có thể sử dụng nhóm non-capturing như sau:

import re

s = 'Python 3.10'
pattern = '(?:\d+)\.(\d+)'

match = re.search(pattern, s)

# hiển thị kết quả khớp toàn bộ
print(match.group())

# hiển thị các nhóm
for group in match.groups():
    print(group)

Kết quả:

3.10
10

Trong ví dụ này, chúng ta sử dụng nhóm non-capturing cho nhóm đầu tiên:

(?:\d+)

Để chỉ bắt phiên bản phụ, bạn có thể bỏ qua nhóm non-capturing ở vị trí đầu tiên như sau:

import re

s = 'Python 3.10'
pattern = '\d+\.(\d+)'
match = re.search(pattern, s)

# hiển thị kết quả khớp toàn bộ
print(match.group())

# hiển thị các nhóm
for group in match.groups():
    print(group)

Kết quả:

3.10
10

Vậy tại sao bạn lại sử dụng nhóm non-capturing? Lý do là để tiết kiệm bộ nhớ, vì regex engine không cần lưu trữ các nhóm trong bộ đệm.

Kết bài

Nhóm non-capturing trong regex của Python giúp bạn tạo ra các nhóm mà không cần lưu trữ chúng trong kết quả khớp, giúp tiết kiệm bộ nhớ và tối ưu hóa hiệu suất. Bằng cách sử dụng cú pháp (?), bạn có thể tạo ra các mẫu regex phức tạp một cách hiệu quả mà không làm tăng chi phí lưu trữ không cần thiết. Đây là một công cụ mạnh mẽ và linh hoạt, giúp bạn viết các biểu thức chính quy một cách hiệu quả và tối ưu hơn.

Cùng chuyên mục:

Cách thêm Progress Bar trong Python với chỉ một dòng Code

Cách thêm Progress Bar trong Python với chỉ một dòng Code

Toán tử Walrus Operator- Tính năng mới trong Python 3.8

Toán tử Walrus Operator- Tính năng mới trong Python 3.8

Cách nạp dữ liệu Machine Learning từ File trong Python

Cách nạp dữ liệu Machine Learning từ File trong Python

Hướng dẫn sử dụng Google Sheets API với Python

Hướng dẫn sử dụng Google Sheets API với Python

Xây dựng  web Python tự động hóa Twitter | Flask, Heroku, Twitter API & Google Sheets API

Xây dựng web Python tự động hóa Twitter | Flask, Heroku, Twitter API & Google Sheets API

Xây dựng Web Machine Learning đẹp mắt với Streamlit và Scikit-learn trong Python

Xây dựng Web Machine Learning đẹp mắt với Streamlit và Scikit-learn trong Python

Hướng dẫn tạo Chatbot đơn giản bằng PyTorch

Hướng dẫn tạo Chatbot đơn giản bằng PyTorch

11 mẹo và thủ thuật để viết Code Python hiệu quả hơn

11 mẹo và thủ thuật để viết Code Python hiệu quả hơn

Hướng dẫn làm ứng dụng TODO với Flask dành cho người mới bắt đầu trong Python

Hướng dẫn làm ứng dụng TODO với Flask dành cho người mới bắt đầu trong Python

Hướng dẫn viết Snake Game bằng Python

Hướng dẫn viết Snake Game bằng Python

Cách sử dụng chế độ interactive trong Python

Cách sử dụng chế độ interactive trong Python

Cách sử dụng Python Debugger với hàm breakpoint()

Cách sử dụng Python Debugger với hàm breakpoint()

Xây dựng ứng dụng Web Style Transfer với PyTorch và Streamlit

Xây dựng ứng dụng Web Style Transfer với PyTorch và Streamlit

Cách cài đặt Jupyter Notebook trong môi trường Conda và thêm Kernel

Cách cài đặt Jupyter Notebook trong môi trường Conda và thêm Kernel

Hướng dẫn xây dựng ứng dụng dự đoán giá cổ phiếu bằng Python

Hướng dẫn xây dựng ứng dụng dự đoán giá cổ phiếu bằng Python

Hướng dẫn tạo ứng dụng AI hội thoại với NVIDIA Jarvis trong Python

Hướng dẫn tạo ứng dụng AI hội thoại với NVIDIA Jarvis trong Python

Hỗ trợ Async trong Django 3.1

Hỗ trợ Async trong Django 3.1

8 mẹo tái cấu trúc Python giúp mã sạch hơn và Pythonic

8 mẹo tái cấu trúc Python giúp mã sạch hơn và Pythonic

Ý nghĩa của if __name__ ==

Ý nghĩa của if __name__ == "__main__" trong Python

Cách xóa phần tử trong danh sách Python

Cách xóa phần tử trong danh sách Python

Top