Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.
Kiểu dữ liệu Set trong Python
Trong bài này chúng ta sẽ tìm hiểu kiểu dữ liệu Set trong Python với các thao tác như: Cách khởi tạo Set, thêm hoặc xóa các thành phần tử ra khỏi Set, và các thao tác thường dùng trên Set.
Các kiểu dữ liệu trong Python quả thật rườm rà, tại sao có mảng, tuple rồi mà lại thêm kiểu tập hợp Set làm gì nữa? Cái gì cũng có lý do của nó các bạn ạ. Sau đây chúng ta sẽ tìm hiểu về Set nhé.
1. Set trong Python là gì?
Set trong Python là tập các phần tử dữ liệu không có thứ tự, mỗi phần tử là duy nhất (không trùng lặp) và phải bất biến (không thể thay đổi). Tuy nhiên chúng ta có thể thêm hoặc xóa các phần tử ra khỏi Set một cách dễ dàng.
Cú pháp
Sau đây là cú pháp tạo Set trong Python.
Bài viết này được đăng tại [free tuts .net]
my_set = {element_1, element_2, element_3, ...}
Trong đó mỗi element là một phần tử và có thể có thuộc nhiều kiểu dữ liệu khác nhau, không nhất thiết phải đồng nhất.
Vì các phần tử không thể thay đổi giá trị nên Set không cho phép lưu trữ kiểu List hoặc Dictionary.
# Tập hợp set kiểu int my_set = {1, 2, 3} print(my_set) # Tập hợp set đa dạng kiểu khác my_set = {1.0, "Hello", (1, 2, 3)} print(my_set)
Như bạn thấy, ở ví dụ đầu tiên thì mình truyền dữ liệu đơn giản, còn ở ví dụ thứ hai thì có thểm kiểu Tuple.
# Set không chứa dữ liệu trùng nhau # Như trong tập hợp này mình cố tình cho trùng giá trị 3 # Nhưng khi in ra thì nó chỉ lấy 1 số 3 mà thôi my_set = {1,2,3,4,3,2} print(my_set) # Output: {1, 2, 3, 4} # Set không thể chứa tập hợp có thể thay đổi như Dictionary và List # Nên đoạn code này sẽ bị lỗi TypeError # Do nó chứa mảng [3,4] my_set = {1, 2, [3, 4]} # TypeError: unhashable type: 'list' # Ta có thể khởi tạo giá trị của set qua ... # đối tượng Set() trong Python # bằng cách truyền vào một list (array) my_set = set([1,2,3,2]) print(my_set) # Output: {1, 2, 3}
Ở ví dụ này mình đã cố tình truyền dữ liệu bị trùng và kết quả là nó lọc hết chỉ giữ lại 1 giá trị bị trùng mà thôi. Ở ví dụ cuối cùng là mình đã khởi tạo một Set từ List chứ không phải tạo phần tử Set chứa kiểu dữ liệu List đâu nhé, đừng nhầm lẫn đoạn đó.
Khởi tạo Set rỗng
Việc khởi tạo Set rỗng sẽ có chút nhầm lẫn, việc sử dụng cặp {} sẽ gây hiểu lầm với kiểu dữ liệu Dictionary, vì vậy để khởi tạo một Set rỗng thì nên sử dụng đối tượng Set() và không truyền bất kì đối số nào vào.
# Khởi tạo bằng cặp {} a = {} # Kiểm tra kiểu dữ liệu thì nó là một dictionary print(type(a)) # Output: <class 'dict'> # Khởi tạo bằng set() a = set() # Kiểm tra kiểu dữ liệu thì là một Set print(type(a)) # Output: <class 'set'>
2. Làm thế nào để thay đổi Set trong Python?
Set không phải là kiểu dữ liệu có chỉ mục nên việc truy xuất thông qua chỉ mục index là điều không thể. Tuy nhiên nó hỗ trợ một số phương thức giúp ban làm điều này.
add()
dùng để thêm phần tửupdate()
dùng để cập nhật phần tử
Hãy đọc kỹ phần ví dụ dưới đây sẽ giúp bạn hiểu rõ hơn.
# Khởi tạo set my_set my_set = {1,3} print(my_set) # Nếu bạn bỏ comment ở dòng 9, # bạn set nhận một lỗi là # TypeError: 'set' object does not support indexing #my_set[0] # Thêm một phần tử vào set my_set.add(2) print(my_set) # Output: {1, 2, 3} # Thêm nhiều phần tử vào Set, ta dùng mảng để chứa các phần tử đó my_set.update([2,3,4]) print(my_set) # Output: {1, 2, 3, 4} # Cập nhật set bằng một list và set mới # Nó sẽ duyệt và loại bỏ bớt giá trị trùng nhau my_set.update([4,5], {1,6,8}) print(my_set) # Output: {1, 2, 3, 4, 5, 6, 8}
Chạy lên kết quả sẽ như sau:
{1, 3} {1, 2, 3} {1, 2, 3, 4} {1, 2, 3, 4, 5, 6, 8}
3. Làm sao để xóa phần tử ra khỏi Set trong Python
Để loại bỏ phần tử ra khỏi Set thì ta sử dụng hai phương thức discard()
và remove()
. Cả hai đều có chung một mục đích, tuy nhiên điểm khác biệt là với discard()
thì sẽ không sinh lỗi nếu giá trị cần xóa không tồn tại, còn remove()
thì sẽ sinh lỗi.
Ví dụ dưới đây sẽ minh họa cho điều này:
# Khởi tạo my_set my_set = {1, 3, 4, 5, 6} print(my_set) # Xóa phần tử có giá trị 4 my_set.discard(4) print(my_set) # Output: {1, 3, 5, 6} # Xóa phần tử có giá trị 6 my_set.remove(6) print(my_set) # Output: {1, 3, 5} # Xóa phần tử # không tồn tại trong my_set my_set.discard(2) print(my_set) # Output: {1, 3, 5} => Không bị lỗi # Xóa một phần tử # không tồn tại trong my_set # thì sẽ bị lỗi, do dùng phương thức remove my_set.remove(2) # Output: KeyError: 2
Tương tự, chúng ta có thể xóa và trả về phần tử đã xóa bằng phươn thức pop()
, hoặc xóa toàn bộ phần tử bằng phương thức clear()
.
# Khởi tạo my_set my_set = set("HelloWorld") print(my_set) # Output: {'r', 'd', 'o', 'e', 'W', 'H', 'l'} # pop một phần tử ngẫu nhiên print(my_set.pop()) # Output: Tùy thuộc vào giá trị mà nó xóa mà in kết quả khác nhau # pop thêm một phần tử ngẫu nhiên khác my_set.pop() print(my_set) # Output: Cũng là random # clear my_set, kết quả trả về Set rỗng my_set.clear() print(my_set) #Output: set()
4. Các hành phép tập hợp của Set trong Python
Set có thể sử dụng với nhiều phép toán như liên kết, hợp, ... bằng cách sử dụng các toán tử và phương thức mà nó hỗ trợ sẵn.
Set union
Toán tử union kí hiệu là |
, nó sẽ trả về hợp của hai Set
# Khởi tạo set A và B A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} # Sử dụng toán tử union | print(A | B) # Output: {1, 2, 3, 4, 5, 6, 7, 8}
Set Intersection
Phép giao intersection ký hiệu là &
, nó sẽ trả về phần giao của hai set
# Khởi tạo set A và B A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} # Sử dụng toán tử & print(A & B) # Output: {4, 5}
Set Difference
Phép Difference kí hiệu là -
, nó sẽ trả về các phần tử của A không có trong B
# Khởi tạo set A và B A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} # Sử dụng toán tử - print(A - B) # Output: {1, 2, 3}
Set Symmetric Difference
Toán tử Set Symmetric Difference kí hiệu là ^
, Nó sẽ trả về phần tử A không có trong B và phần tử B không có trong A.
# Khởi tạo A và B A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} # Sử dụng toán tử ^ print(A ^ B) # Output: {1, 2, 3, 6, 7, 8}
5. Các thao tác khác với Set trong Python
Bây giờ mình sẽ làm một vài ví dụ về các thao tác khác thường gặp trên Set, đây là những thao tác được sử dụng rất nhiều khi bạn làm việc với Python.
Kiểm tra phần tử tồn tại trong Set
Để kiểm tra một phần tử có tồn tại không trong Set thì ta sử dụng toán tử in
, toán tử này được sử dụng khá nhiều, hầu như tất cả các loại dữ liệu đều có.
# Khởi tạo my_set my_set = set("apple") # Kiểm tra xem 'a' có tồn tại trong set không print('a' in my_set) # Output: True # Kiểm tra xem 'p' có tồn tại trong set không print('p' not in my_set) # Output: False
Lặp qua các phần tử của Set
Để lặp qua các phần tử của Set thì ta có thể sử dụng vòng lặp for, đây là vòng lặp được sử dụng nhiều nhất trong Python.
for letter in set("apple"): print(letter) # Result: # p # l # a # e
6. Lời kết
Như vậy là mình đã giới thiệu xong kiến thức cơ bản về tập hợp Set trong Python.
Bạn cần lưu ý rằng với Set thì không thể thay đổi giá trị của các phần tử, bản chất khi sử dụng phương thức update là bạn đã bổ sung các phần tử. Tuy nhiên bạn có thể thực hiện các thao tác xóa phần tử ra khỏi set