PYTHON REGEX
CÁC CHỦ ĐỀ
BÀI MỚI NHẤT
MỚI CẬP NHẬT

Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.

Lookahead trong Python Regex

Trong bài viết này, bạn sẽ tìm hiểu về lookahead trong regex của Python, một công cụ mạnh mẽ để xử lý và kiểm tra chuỗi ký tự theo các quy tắc phức tạp. Lookahead cho phép bạn xác định các mẫu (pattern) chỉ khi chúng được theo sau bởi các điều kiện cụ thể, hoặc ngược lại, không được theo sau bởi các điều kiện đó. Điều này giúp bạn tạo ra các biểu thức chính quy (regular expressions) tinh vi và linh hoạt hơn, phục vụ cho nhiều mục đích khác nhau trong xử lý chuỗi và dữ liệu.

test php

banquyen png
Bài viết này được đăng tại freetuts.net, không được copy dưới mọi hình thức.

Giới thiệu về Lookahead trong Python Regex

Đôi khi, bạn muốn khớp với X nhưng chỉ khi nó được theo sau bởi Y. Trong trường hợp này, bạn có thể sử dụng lookahead trong các biểu thức chính quy.

Cú pháp của lookahead như sau:

X(?=Y)

Cú pháp này có nghĩa là tìm X nhưng chỉ khớp nếu nó được theo sau bởi Y.

Bài viết này được đăng tại [free tuts .net]

Ví dụ, giả sử bạn có chuỗi sau:

'1 Python dài khoảng 4 feet'

Và bạn muốn khớp với số (4) được theo sau bởi một khoảng trắng và chuỗi ký tự 'feet', không phải số 1. Trong trường hợp này, bạn có thể sử dụng mẫu sau chứa lookahead:

\d+(?=\s*feet)

Trong mẫu này:

  • \d+ là sự kết hợp của tập hợp ký tự số với toán tử + để khớp với một hoặc nhiều chữ số.
  • ?= là cú pháp của lookahead.
  • \s* là sự kết hợp của tập hợp ký tự khoảng trắng và toán tử * để khớp với không hoặc nhiều khoảng trắng.
  • feet khớp với chuỗi ký tự 'feet'.

Đoạn mã sau sử dụng mẫu trên để khớp với số được theo sau bởi không hoặc nhiều khoảng trắng và chuỗi ký tự 'feet':

import re

s = '1 Python dài khoảng 4 feet'
pattern = '\d+(?=\s*feet)'

matches = re.finditer(pattern, s)
for match in matches:
    print(match.group())

Kết quả:

4

Lookahead nhiều lần trong Regex

Regex cho phép bạn có nhiều lookahead với cú pháp sau:

X(?=Y)(?=Z)

Trong cú pháp này, regex engine sẽ thực hiện các bước sau:

  • Tìm X.
  • Kiểm tra nếu Y nằm ngay sau X, bỏ qua nếu không phải.
  • Kiểm tra nếu Z cũng nằm ngay sau Y, bỏ qua nếu không phải.
  • Nếu cả hai kiểm tra đều thành công, X sẽ khớp; nếu không, tìm kiếm kết quả khớp tiếp theo.

Vậy mẫu X(?=Y)(?=Z) khớp với X theo sau bởi cả Y và Z cùng một lúc.

Negative Lookahead trong Regex

Giả sử bạn muốn khớp chỉ số 1 trong văn bản sau mà không phải số 4:

'1 Python dài khoảng 4 feet'

Để làm điều đó, bạn có thể sử dụng cú pháp negative lookahead:

X(?!Y)

Mẫu X(?!Y) khớp với X chỉ khi nó không được theo sau bởi Y. Nó là \d+ không theo sau bởi chuỗi ký tự 'feet':

import re

s = '1 Python dài khoảng 4 feet'
pattern = '\d+(?!\s*feet)'

matches = re.finditer(pattern, s)
for match in matches:
    print(match.group())

Kết quả:

1

Kết bài

Việc sử dụng lookahead trong Python regex với cú pháp X(?=Y) cho phép bạn khớp với X chỉ khi nó được theo sau bởi Y, trong khi sử dụng negative lookahead với cú pháp X(?!Y) cho phép bạn khớp với X chỉ khi nó không được theo sau bởi Y. Những kỹ thuật này cung cấp khả năng kiểm tra và xử lý chuỗi một cách linh hoạt và chính xác, giúp bạn dễ dàng áp dụng vào nhiều tình huống khác nhau trong lập trình và phân tích dữ liệu.

Cùng chuyên mục:

Cách thêm Progress Bar trong Python với chỉ một dòng Code

Cách thêm Progress Bar trong Python với chỉ một dòng Code

Toán tử Walrus Operator- Tính năng mới trong Python 3.8

Toán tử Walrus Operator- Tính năng mới trong Python 3.8

Cách nạp dữ liệu Machine Learning từ File trong Python

Cách nạp dữ liệu Machine Learning từ File trong Python

Hướng dẫn sử dụng Google Sheets API với Python

Hướng dẫn sử dụng Google Sheets API với Python

Xây dựng  web Python tự động hóa Twitter | Flask, Heroku, Twitter API & Google Sheets API

Xây dựng web Python tự động hóa Twitter | Flask, Heroku, Twitter API & Google Sheets API

Xây dựng Web Machine Learning đẹp mắt với Streamlit và Scikit-learn trong Python

Xây dựng Web Machine Learning đẹp mắt với Streamlit và Scikit-learn trong Python

Hướng dẫn tạo Chatbot đơn giản bằng PyTorch

Hướng dẫn tạo Chatbot đơn giản bằng PyTorch

11 mẹo và thủ thuật để viết Code Python hiệu quả hơn

11 mẹo và thủ thuật để viết Code Python hiệu quả hơn

Hướng dẫn làm ứng dụng TODO với Flask dành cho người mới bắt đầu trong Python

Hướng dẫn làm ứng dụng TODO với Flask dành cho người mới bắt đầu trong Python

Hướng dẫn viết Snake Game bằng Python

Hướng dẫn viết Snake Game bằng Python

Cách sử dụng chế độ interactive trong Python

Cách sử dụng chế độ interactive trong Python

Cách sử dụng Python Debugger với hàm breakpoint()

Cách sử dụng Python Debugger với hàm breakpoint()

Xây dựng ứng dụng Web Style Transfer với PyTorch và Streamlit

Xây dựng ứng dụng Web Style Transfer với PyTorch và Streamlit

Cách cài đặt Jupyter Notebook trong môi trường Conda và thêm Kernel

Cách cài đặt Jupyter Notebook trong môi trường Conda và thêm Kernel

Hướng dẫn xây dựng ứng dụng dự đoán giá cổ phiếu bằng Python

Hướng dẫn xây dựng ứng dụng dự đoán giá cổ phiếu bằng Python

Hướng dẫn tạo ứng dụng AI hội thoại với NVIDIA Jarvis trong Python

Hướng dẫn tạo ứng dụng AI hội thoại với NVIDIA Jarvis trong Python

Hỗ trợ Async trong Django 3.1

Hỗ trợ Async trong Django 3.1

8 mẹo tái cấu trúc Python giúp mã sạch hơn và Pythonic

8 mẹo tái cấu trúc Python giúp mã sạch hơn và Pythonic

Ý nghĩa của if __name__ ==

Ý nghĩa của if __name__ == "__main__" trong Python

Cách xóa phần tử trong danh sách Python

Cách xóa phần tử trong danh sách Python

Top