Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.
Iterator vs Iterable trong Python
Trong bài viết này, mình sẽ tìm hiểu khái niệm về Iterator và Iterable là hai khái niệm cơ bản nhưng lại rất quan trọng. Mình thường xuyên gặp phải chúng khi làm việc với các cấu trúc dữ liệu và vòng lặp. Để hiểu rõ hơn về chúng và sự khác biệt giữa chúng, hãy đi vào chi tiết từng khái niệm.
Giới thiệu Iterable và Iterator trong Python
Trong Python, một iterable là một đối tượng mà bạn có thể duyệt qua từng phần tử của nó, thông qua một vòng lặp for hoặc sử dụng các hàm như iter()
và next()
. Để là một iterable, đối tượng phải triển khai phương thức __iter__()
, và khi gọi phương thức này nó phải trả về một iterator.
Một iterator là một đối tượng mà bạn có thể sử dụng để duyệt qua các phần tử của một iterable. Iterator phải triển khai hai phương thức: __iter__()
(trả về chính nó là một iterator) và __next__()
(trả về phần tử tiếp theo trong iterable). Khi không còn phần tử nào để trả về, iterator sẽ ném ra một ngoại lệ StopIteration
.
Sự khác biệt giữa Iterator và Iterable
Iterable:
Bài viết này được đăng tại [free tuts .net]
- Là một đối tượng mà bạn có thể duyệt qua từng phần tử của nó.
- Có phương thức
__iter__()
để trả về một iterator. - Ví dụ: danh sách (list), tuple, dictionary, v.v.
Iterator:
- Là một đối tượng mà bạn có thể sử dụng để duyệt qua từng phần tử của một iterable.
- Phải triển khai phương thức
__iter__()
(trả về chính nó) và__next__()
(trả về phần tử tiếp theo). - Khi duyệt hết các phần tử, sẽ ném ra ngoại lệ
StopIteration
. - Ví dụ: các iterator được tạo ra từ list, tuple, dictionary, v.v.
Việc hiểu rõ sự khác biệt và cách thức hoạt động của Iterator và Iterable là rất quan trọng trong Python, giúp bạn hiểu rõ hơn về cách các cấu trúc dữ liệu và vòng lặp hoạt động, từ đó làm việc hiệu quả hơn khi lập trình.
Kiểm tra với danh sách và iterator của danh sách trong Python
Trong Python, một danh sách là một bộ sưu tập có thứ tự các phần tử. Đồng thời, nó cũng là một iterable vì một đối tượng danh sách có phương thức __iter__
trả về một iterator. Ví dụ:
numbers = [1, 2, 3] number_iterator = numbers.__iter__() print(type(number_iterator)) # Output: <class 'list_iterator'>
Vì list_iterator triển khai phương thức __next__
, bạn có thể sử dụng hàm next
để duyệt qua danh sách:
numbers = [1, 2, 3] number_iterator = iter(numbers) next(number_iterator) next(number_iterator) next(number_iterator)
Nếu gọi hàm next
một lần nữa, bạn sẽ nhận được ngoại lệ StopIteration
, vì iterator đã được duyệt hết.
Iterator và Iterable trong Python
Dưới đây là định nghĩa của lớp Colors:
class Colors: def __init__(self): self.rgb = ['red', 'green', 'blue'] self.__index = 0 def __iter__(self): return self def __next__(self): if self.__index >= len(self.rgb): raise StopIteration color = self.rgb[self.__index] self.__index += 1 return color
Trong ví dụ này, lớp Colors đồng thời là một iterator vì nó triển khai cả __iter__
và __next__
. Phương thức __iter__
trả về chính đối tượng của nó là một iterator.
Lớp Colors cũng là một iterable vì nó triển khai phương thức __iter__
và trả về một iterator mới.
Đoạn mã sau đây thể hiện cách sử dụng lớp Colors để duyệt qua các phần tử của nó bằng vòng lặp for:
colors = Colors() for color in colors: print(color)
Khi bạn đã duyệt qua hết, đối tượng colors trở thành không còn dùng được nữa. Nếu cố gắng duyệt qua nó một lần nữa, bạn sẽ nhận được ngoại lệ StopIteration
.
Tách biệt iterator và iterable trong Python
Nếu muốn tách biệt iterator ra khỏi iterable như Python làm với list và list_iterator, bạn có thể làm như sau:
class Colors: def __init__(self): self.rgb = ['red', 'green', 'blue'] def __len__(self): return len(self.rgb) class ColorIterator: def __init__(self, colors): self.__colors = colors self.__index = 0 def __iter__(self): return self def __next__(self): if self.__index >= len(self.__colors): raise StopIteration color = self.__colors.rgb[self.__index] self.__index += 1 return color
Trong ví dụ này, ColorIterator là một iterator độc lập và Colors là một iterable. Bạn có thể sử dụng ColorIterator để duyệt qua các phần tử của Colors như sau:
colors = Colors() color_iterator = ColorIterator(colors) for color in color_iterator: print(color)
Để làm cho Colors trở thành một iterable một cách tự động, bạn có thể triển khai phương thức __iter__
để trả về một ColorIterator mới.
Kết bài
Một khi đã hiểu được sự khác biệt giữa iterable và iterator trong Python, chúng ta có thể tổng kết như sau:
- Một iterable là một đối tượng triển khai phương thức
__iter__
, và phương thức này trả về một iterator. - Một iterator là một đối tượng triển khai cả
__iter__
(trả về chính nó) và__next__
(trả về phần tử kế tiếp trong iterable). - Đáng chú ý, một iterator cũng là một iterable, vì nó triển khai phương thức
__iter__
và có thể được sử dụng để duyệt qua các phần tử của chính nó.
Việc hiểu rõ sự tương quan giữa iterable và iterator là cực kỳ quan trọng để sử dụng Python một cách hiệu quả và linh hoạt trong việc xử lý dữ liệu và vòng lặp. Điều này cũng giúp bạn áp dụng các cấu trúc dữ liệu và các vòng lặp trong Python một cách thông minh và hiệu quả nhất.