Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.
Tìm hiểu Generators trong Python
Bài viết này sẽ giới thiệu về Python generators và cách chúng được sử dụng để tạo các iterators. Generators là một tính năng mạnh mẽ của Python cho phép bạn tạo các chuỗi giá trị một cách lười biếng, tức là chỉ tính toán giá trị khi cần thiết và lưu trữ trạng thái của hàm gọi đến khi nó được gọi lại.
Giới thiệu về Generators trong Python
Trong Python, generator là một loại hàm đặc biệt có thể tạm dừng và tiếp tục thực thi từng phần của hàm một cách linh hoạt. Thay vì sử dụng từ khóa return
như trong hàm thông thường, generator sử dụng từ khóa yield
để trả về các giá trị một cách tuần tự, giữ cho trạng thái của hàm nguyên vẹn giữa các lần gọi.
Khi gọi một generator function, Python trả về một đối tượng generator, là một loại iterator. Điều này cho phép bạn duyệt qua từng giá trị được tạo ra bởi generator một cách hiệu quả và tiết kiệm bộ nhớ.
Điều này có nghĩa là Python không thể tạm dừng một hàm thông thường giữa chừng và sau đó tiếp tục từ đó. Ví dụ:
Bài viết này được đăng tại [free tuts .net]
def greeting(): print('Xin chào!') print('Bạn có khỏe không?') print('Bạn ở đây không?')
Khi Python thực thi hàm greeting()
, nó thực thi mã từng dòng từ đầu đến cuối.
Python cũng không thể tạm dừng hàm tại dòng sau:
print('Bạn có khỏe không?')
... và chuyển đến một mã khác và tiếp tục thực thi từ dòng đó.
Để tạm dừng một hàm giữa chừng và tiếp tục từ nơi hàm đã tạm dừng, bạn sử dụng câu lệnh yield
.
Khi một hàm chứa ít nhất một câu lệnh yield
, đó là một generator function.
Theo định nghĩa, generator là một hàm chứa ít nhất một câu lệnh yield
.
Khi bạn gọi một generator function, nó trả về một đối tượng generator mới. Tuy nhiên, nó không khởi động hàm.
Đối tượng generator (hoặc generator) thực hiện giao thức iterator. Trong thực tế, các generator là iterators lười biếng. Do đó, để thực thi một generator function, bạn gọi hàm next()
tích hợp trên nó.
Ví dụ đơn giản về generator trong Python
Xem ví dụ sau:
def greeting(): print('Xin chào!') yield 1 print('Bạn có khỏe không?') yield 2 print('Bạn ở đây không?') yield 3
Vì hàm greeting()
chứa các câu lệnh yield
, đây là một generator function.
Câu lệnh yield
tương tự như câu lệnh return
trong một hàm. Tuy nhiên, có một sự khác biệt lớn.
Khi Python gặp phải câu lệnh yield
, nó trả về giá trị được chỉ định trong câu lệnh yield
. Ngoài ra, nó tạm dừng việc thực thi của hàm.
Nếu bạn "gọi" cùng một hàm lại, Python sẽ tiếp tục từ câu lệnh yield
trước đó.
Khi bạn gọi một generator function, nó trả về một đối tượng generator. Ví dụ:
messenger = greeting()
messenger
là một đối tượng generator, cũng là một iterator.
Để thực sự thực thi phần thân của hàm greeting()
, bạn cần sử dụng hàm tích hợp next()
:
result = next(messenger) print(result)
Khi hàm greeting()
thực thi, nó hiển thị tin nhắn đầu tiên và trả về 1:
Xin chào! 1
Nó cũng tạm dừng ngay tại câu lệnh yield
đầu tiên. Nếu bạn "gọi" hàm greeting()
một lần nữa, nó sẽ tiếp tục thực thi từ câu lệnh yield
cuối cùng:
result = next(messenger) print(result)
Kết quả:
Bạn có khỏe không? 2
Và bạn có thể gọi nó một lần nữa:
result = next(messenger) print(result)
Kết quả:
Bạn ở đây không? 3
Tuy nhiên, nếu bạn thực thi generator một lần nữa, nó sẽ gây ra ngoại lệ StopIteration
vì nó là một iterator:
next(messenger)
Lỗi:
StopIteration
Sử dụng generators để tạo iterators trong Python
Ví dụ sau định nghĩa một iterator trả về bình phương của một số nguyên.
class Squares: def __init__(self, length): self.length = length self.current = 0 def __iter__(self): return self def __next__(self): result = self.current ** 2 self.current += 1 if self.current > self.length: raise StopIteration return result
Bạn có thể sử dụng iterator Squares để tạo các số bình phương của 5 số nguyên đầu tiên từ 0 đến 5:
length = 5 square = Squares(length) for s in square: print(s)
Đoạn mã này hoạt động như mong đợi. Nhưng có một vấn đề là có rất nhiều boilerplate.
Và như bạn có thể đoán, bạn sử dụng một generator function để xây dựng iterator đó.
Phần tiếp theo viết lại iterator Squares như một generator function:
def squares(length): for n in range(length): yield n ** 2
Như bạn có thể thấy, nó ngắn gọn hơn và rõ ràng hơn nhiều. Việc sử dụng hàm generator squares tương tự như iterator ở trên:
length = 5 square = squares(length) for s in square: print(s)
Kết bài
Như vậy, ta đã tìm hiểu về Python generators và cách chúng được sử dụng để tạo các iterators trong Python. Để tổng kết lại:
- Python generators là các hàm chứa ít nhất một câu lệnh
yield
. - Một generator function trả về một đối tượng generator, là một loại iterator.
- Đối tượng generator là một iterator và sẽ bị sử dụng hết khi không còn mục nào để trả về nữa, khiến nó phát sinh ngoại lệ
StopIteration
.
Sử dụng Python generators giúp giảm thiểu việc sử dụng bộ nhớ và tăng tính linh hoạt của mã, đặc biệt là khi xử lý các tập dữ liệu lớn hoặc không xác định trước số lượng phần tử. Việc này làm cho các vòng lặp và xử lý dữ liệu trở nên hiệu quả hơn và dễ dàng hơn để quản lý.
Hy vọng rằng bài viết này đã giúp bạn hiểu rõ hơn về Python generators và cách chúng có thể được áp dụng trong các dự án Python của bạn.