Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.
Sự khác biệt giữa Tuple và List trong Python
Trong Python, cả tuple và list đều là các loại cấu trúc dữ liệu quan trọng được sử dụng để lưu trữ một tập hợp các phần tử. Tuy nhiên, mặc dù có nhiều điểm tương đồng, chúng lại có những khác biệt cơ bản quan trọng. Việc hiểu rõ sự khác nhau giữa tuple và list không chỉ giúp bạn chọn loại cấu trúc dữ liệu phù hợp cho từng trường hợp cụ thể mà còn giúp tối ưu hóa hiệu suất và hiệu quả của mã nguồn. Trong bài viết này, mình sẽ tìm những điểm khác biệt chính giữa tuple và list, bao gồm tính bất biến, hiệu quả lưu trữ, và hiệu suất sao chép, giúp bạn có cái nhìn sâu sắc hơn về cách sử dụng chúng trong các dự án lập trình của mình.
Cả tuple và list đều là các loại chuỗi (sequence types). Tuy nhiên, chúng có một số điểm khác biệt chính.
Tuple là bất biến trong khi list là có thể thay đổi trong Python
Ví dụ sau đây định nghĩa một list và thay đổi phần tử đầu tiên:
fruits = ['apple', 'orange', 'banana'] fruits[0] = 'strawberry' print(fruits)
Kết quả:
Bài viết này được đăng tại [free tuts .net]
['strawberry', 'orange', 'banana']
Như bạn có thể thấy từ kết quả, bạn có thể thay đổi một list. Tuy nhiên, bạn không thể thay đổi một tuple. Ví dụ sau sẽ dẫn đến lỗi:
fruits = ('apple', 'orange', 'banana') fruits[0] = 'strawberry'
Lỗi:
TypeError: 'tuple' object does not support item assignment
Python không cho phép bạn thay đổi phần tử của một tuple. Nhưng bạn có thể tham chiếu một tuple mới. Ví dụ:
fruits = ('apple', 'orange', 'banana') fruits = ('strawberry', 'orange', 'banana')
Trong ví dụ này, Python tạo một tuple mới và gán biến fruits
cho tuple mới tạo.
Nếu bạn kiểm tra địa chỉ bộ nhớ của các đối tượng tuple, bạn sẽ thấy rằng biến fruits
tham chiếu đến một địa chỉ bộ nhớ khác sau khi gán:
fruits = ('apple', 'orange', 'banana') print(hex(id(fruits))) fruits = ('strawberry', 'orange', 'banana') print(hex(id(fruits)))
Kết quả:
0x1c018286e00 0x1c018286e40
Hiệu quả lưu trữ của tuple cao hơn list trong Python
Một list có thể thay đổi, nghĩa là bạn có thể thêm nhiều phần tử hơn vào nó. Vì lý do này, Python cần phân bổ thêm bộ nhớ cho list. Điều này được gọi là "phân bổ quá mức" (over-allocating). Việc phân bổ quá mức cải thiện hiệu suất khi một list được mở rộng.
Trong khi đó, một tuple là bất biến nên số lượng phần tử của nó cố định. Vì vậy, Python chỉ cần phân bổ đủ bộ nhớ để lưu trữ các phần tử ban đầu.
Kết quả là, hiệu quả lưu trữ của tuple cao hơn list.
Để lấy kích thước của một đối tượng, bạn sử dụng hàm getsizeof
từ mô-đun sys
.
Ví dụ sau đây cho thấy kích thước của một list và một tuple chứa các phần tử giống nhau:
from sys import getsizeof fruit_list = ['apple', 'orange', 'banana'] fruit_list2 = list(fruit_list) print(id(fruit_list) == id(fruit_list2)) # False fruits = ['apple', 'orange', 'banana'] print(f'The size of the list is {getsizeof(fruits)} bytes.') fruits = ('strawberry', 'orange', 'banana') print(f'The size of the tuple is {getsizeof(fruits)} bytes.')
Kết quả:
The size of the list is 80 bytes. The size of the tuple is 64 bytes.
Sao chép một tuple nhanh hơn sao chép một list trong Python
Khi bạn sao chép một list, Python tạo một list mới. Ví dụ sau minh họa việc sao chép một list sang list khác:
fruit_list = ['apple', 'orange', 'banana'] fruit_list2 = list(fruit_list) print(id(fruit_list) == id(fruit_list2)) # False
Tuy nhiên, khi sao chép một tuple, Python chỉ sử dụng lại tuple hiện có. Nó không tạo ra một tuple mới vì các tuple là bất biến.
fruit_tuple = ('apple', 'orange', 'banana') fruit_tuple2 = tuple(fruit_tuple) print(id(fruit_tuple) == id(fruit_tuple2)) # True
Do đó, sao chép một tuple luôn nhanh hơn một list một chút.
Ví dụ sau đây so sánh thời gian cần để sao chép một list và một tuple 1 triệu lần:
from timeit import timeit times = 1_000_000 t1 = timeit("list(['apple', 'orange', 'banana'])", number=times) print(f'Time to copy a list {times} times: {t1}') t2 = timeit("tuple(('apple', 'orange', 'banana'))", number=times) print(f'Time to copy a tuple {times} times: {t2}') diff = "{:.0%}".format((t2 - t1)/t1) print(f'difference: {diff}')
Kết bài
Qua bài bài viết này, mình đã thấy rằng tuple và list có những đặc điểm riêng biệt quan trọng. Tuple là bất biến, trong khi list có thể thay đổi. Hiệu quả lưu trữ của tuple cao hơn so với list. Sao chép một tuple nhanh hơn sao chép một list một chút.
Từ những điểm khác biệt trên, mình có thể rút ra kết luận rằng việc lựa chọn giữa tuple và list phụ thuộc vào mục đích sử dụng của bạn. Nếu bạn cần một cấu trúc dữ liệu có thể thay đổi linh hoạt, list sẽ là lựa chọn phù hợp. Ngược lại, nếu bạn không có ý định thay đổi dữ liệu và muốn tận dụng hiệu quả lưu trữ cùng hiệu suất sao chép nhanh hơn, hãy sử dụng tuple. Hiểu rõ những khác biệt này sẽ giúp bạn viết mã hiệu quả và tối ưu hơn trong các dự án Python của mình.