INTRODUCTION
FLOW CONTROL
FUNCTIONS
DATATYPES
OBJECT & CLASS
ADVANCED TOPICS
BỔ SUNG
PYTHON CĂN BẢN
CÁC CHỦ ĐỀ
BÀI MỚI NHẤT
MỚI CẬP NHẬT

Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.

Kiểu dữ liệu Set trong Python

Trong bài này chúng ta sẽ tìm hiểu kiểu dữ liệu Set trong Python với các thao tác như: Cách khởi tạo Set, thêm hoặc xóa các thành phần tử ra khỏi Set, và các thao tác thường dùng trên Set.

test php

banquyen png
Bài viết này được đăng tại freetuts.net, không được copy dưới mọi hình thức.

Các kiểu dữ liệu trong Python quả thật rườm rà, tại sao có mảng, tuple rồi mà lại thêm kiểu tập hợp Set làm gì nữa? Cái gì cũng có lý do của nó các bạn ạ. Sau đây chúng ta sẽ tìm hiểu về Set nhé.

1. Set trong Python là gì?

Set trong Python là tập các phần tử dữ liệu không có thứ tự, mỗi phần tử là duy nhất (không trùng lặp) và phải bất biến (không thể thay đổi). Tuy nhiên chúng ta có thể thêm hoặc xóa các phần tử ra khỏi Set một cách dễ dàng.

Cú pháp

Sau đây là cú pháp tạo Set trong Python.

Bài viết này được đăng tại [free tuts .net]

my_set = {element_1, element_2, element_3, ...}

Trong đó mỗi element là một phần tử và có thể có thuộc nhiều kiểu dữ liệu khác nhau, không nhất thiết phải đồng nhất.

Vì các phần tử không thể thay đổi giá trị nên Set không cho phép lưu trữ kiểu List hoặc Dictionary.

Ví dụ
# Tập hợp set kiểu int
my_set = {1, 2, 3}
print(my_set)

# Tập hợp set đa dạng kiểu khác
my_set = {1.0, "Hello", (1, 2, 3)}
print(my_set)

Như bạn thấy, ở ví dụ đầu tiên thì mình truyền dữ liệu đơn giản, còn ở ví dụ thứ hai thì có thểm kiểu Tuple.

Ví dụ khác
# Set không chứa dữ liệu trùng nhau
# Như trong tập hợp này mình cố tình cho trùng giá trị 3
# Nhưng khi in ra thì nó chỉ lấy 1 số 3 mà thôi
my_set = {1,2,3,4,3,2}
print(my_set)
# Output: {1, 2, 3, 4}

# Set không thể chứa tập hợp có thể thay đổi như Dictionary và List
# Nên đoạn code này sẽ bị lỗi TypeError
# Do nó chứa mảng [3,4]
my_set = {1, 2, [3, 4]}
# TypeError: unhashable type: 'list'

# Ta có thể khởi tạo giá trị của set qua ...
# đối tượng Set() trong Python
# bằng cách truyền vào một list (array)
my_set = set([1,2,3,2])
print(my_set)
# Output: {1, 2, 3}

Ở ví dụ này mình đã cố tình truyền dữ liệu bị trùng và kết quả là nó lọc hết chỉ giữ lại 1 giá trị bị trùng mà thôi. Ở ví dụ cuối cùng là mình đã khởi tạo một Set từ List chứ không phải tạo phần tử Set chứa kiểu dữ liệu List đâu nhé, đừng nhầm lẫn đoạn đó.

Khởi tạo Set rỗng

Việc khởi tạo Set rỗng sẽ có chút nhầm lẫn, việc sử dụng cặp {} sẽ gây hiểu lầm với kiểu dữ liệu Dictionary, vì vậy để khởi tạo một Set rỗng thì nên sử dụng đối tượng Set() và không truyền bất kì đối số nào vào.

Ví dụ
# Khởi tạo bằng cặp {}
a = {}

# Kiểm tra kiểu dữ liệu thì nó là một dictionary
print(type(a))
# Output: <class 'dict'>

# Khởi tạo bằng set()
a = set()

# Kiểm tra kiểu dữ liệu thì là một Set
print(type(a))
# Output: <class 'set'>

2. Làm thế nào để thay đổi Set trong Python?

Set không phải là kiểu dữ liệu có chỉ mục nên việc truy xuất thông qua chỉ mục index là điều không thể. Tuy nhiên nó hỗ trợ một số phương thức giúp ban làm điều này.

  • add() dùng để thêm phần tử
  • update() dùng để cập nhật phần tử

Hãy đọc kỹ phần ví dụ dưới đây sẽ giúp bạn hiểu rõ hơn.

# Khởi tạo set my_set
my_set = {1,3}
print(my_set)

# Nếu bạn bỏ comment ở dòng 9,
# bạn set nhận một lỗi là
# TypeError: 'set' object does not support indexing

#my_set[0]

# Thêm một phần tử vào set
my_set.add(2)
print(my_set)
# Output: {1, 2, 3}

# Thêm nhiều phần tử vào Set, ta dùng mảng để chứa các phần tử đó
my_set.update([2,3,4])
print(my_set)
# Output: {1, 2, 3, 4}

# Cập nhật set bằng một list và set mới
# Nó sẽ duyệt và loại bỏ bớt giá trị trùng nhau
my_set.update([4,5], {1,6,8})
print(my_set)
# Output: {1, 2, 3, 4, 5, 6, 8}

Chạy lên kết quả sẽ như sau:

{1, 3}
{1, 2, 3}
{1, 2, 3, 4}
{1, 2, 3, 4, 5, 6, 8}

3. Làm sao để xóa phần tử ra khỏi Set trong Python

Để loại bỏ phần tử ra khỏi Set thì ta sử dụng hai phương thức discard()remove(). Cả hai đều có chung một mục đích, tuy nhiên điểm khác biệt là với discard() thì sẽ không sinh lỗi nếu giá trị cần xóa không tồn tại, còn remove() thì sẽ sinh lỗi.

Ví dụ dưới đây sẽ minh họa cho điều này:

# Khởi tạo my_set
my_set = {1, 3, 4, 5, 6}
print(my_set)

# Xóa phần tử có giá trị 4
my_set.discard(4)
print(my_set)
# Output: {1, 3, 5, 6}

# Xóa phần tử có giá trị 6
my_set.remove(6)
print(my_set)
# Output: {1, 3, 5}

# Xóa phần tử
# không tồn tại trong my_set
my_set.discard(2)
print(my_set)
# Output: {1, 3, 5} => Không bị lỗi

# Xóa một phần tử
# không tồn tại trong my_set
# thì sẽ bị lỗi, do dùng phương thức remove
my_set.remove(2)
# Output: KeyError: 2

Tương tự, chúng ta có thể xóa và trả về phần tử đã xóa bằng phươn thức pop(), hoặc xóa toàn bộ phần tử bằng phương thức clear().

# Khởi tạo my_set
my_set = set("HelloWorld")
print(my_set)
# Output: {'r', 'd', 'o', 'e', 'W', 'H', 'l'}

# pop một phần tử ngẫu nhiên
print(my_set.pop())
# Output: Tùy thuộc vào giá trị mà nó xóa mà in kết quả khác nhau

# pop thêm một phần tử ngẫu nhiên khác
my_set.pop()
print(my_set)
# Output: Cũng là random

# clear my_set, kết quả trả về Set rỗng
my_set.clear()
print(my_set)
#Output: set()

4. Các hành phép tập hợp của Set trong Python

Set có thể sử dụng với nhiều phép toán như liên kết, hợp, ... bằng cách sử dụng các toán tử và phương thức mà nó hỗ trợ sẵn.

Set union

Toán tử union kí hiệu là |, nó sẽ trả về hợp của hai Set

set union jpg

Ví dụ
# Khởi tạo set A và B
A = {1, 2, 3, 4, 5}
B = {4, 5, 6, 7, 8}

# Sử dụng toán tử union |
print(A | B)
# Output: {1, 2, 3, 4, 5, 6, 7, 8}

Set Intersection

Phép giao intersection ký hiệu là &, nó sẽ trả về phần giao của hai set

set intersection jpg

Ví dụ
# Khởi tạo set A và B
A = {1, 2, 3, 4, 5}
B = {4, 5, 6, 7, 8}

# Sử dụng toán tử &
print(A & B)
# Output: {4, 5}

Set Difference

Phép Difference kí hiệu là -, nó sẽ trả về các phần tử của A không có trong B

set difference jpg

Ví dụ
# Khởi tạo set A và B
A = {1, 2, 3, 4, 5}
B = {4, 5, 6, 7, 8}

# Sử dụng toán tử -
print(A - B)
# Output: {1, 2, 3}

Set Symmetric Difference

Toán tử Set Symmetric Difference kí hiệu là ^, Nó sẽ trả về phần tử A không có trong B và phần tử B không có trong A.

set symmetric difference jpg

Ví dụ
# Khởi tạo A và B
A = {1, 2, 3, 4, 5}
B = {4, 5, 6, 7, 8}

# Sử dụng toán tử ^
print(A ^ B)
# Output: {1, 2, 3, 6, 7, 8}

5. Các thao tác khác với Set trong Python

Bây giờ mình sẽ làm một vài ví dụ về các thao tác khác thường gặp trên Set, đây là những thao tác được sử dụng rất nhiều khi bạn làm việc với Python.

Kiểm tra phần tử tồn tại trong Set

Để kiểm tra một phần tử có tồn tại không trong Set thì ta sử dụng toán tử in, toán tử này được sử dụng khá nhiều, hầu như tất cả các loại dữ liệu đều có.

Ví dụ
# Khởi tạo my_set
my_set = set("apple")

# Kiểm tra xem 'a' có tồn tại trong set không
print('a' in my_set)
# Output: True

# Kiểm tra xem 'p' có tồn tại trong set không
print('p' not in my_set)
# Output: False

Lặp qua các phần tử của Set

Để lặp qua các phần tử của Set thì ta có thể sử dụng vòng lặp for, đây là vòng lặp được sử dụng nhiều nhất trong Python.

Ví dụ
for letter in set("apple"):
    print(letter)

# Result:
# p
# l
# a
# e

6. Lời kết

Như vậy là mình đã giới thiệu xong kiến thức cơ bản về tập hợp Set trong Python.

Bạn cần lưu ý rằng với Set thì không thể thay đổi giá trị của các phần tử, bản chất khi sử dụng phương thức update là bạn đã bổ sung các phần tử. Tuy nhiên bạn có thể thực hiện các thao tác xóa phần tử ra khỏi set

Cùng chuyên mục:

Phạm vi số float của Python

Phạm vi số float của Python

Bài tập Python : Pandas trong Python

Bài tập Python : Pandas trong Python

Hướng dẫn kết nối Python PostgreSQL bằng Psycopg2

Hướng dẫn kết nối Python PostgreSQL bằng Psycopg2

Kết nối cơ sở dữ liệu MySQL Python

Kết nối cơ sở dữ liệu MySQL Python

Bài tập Python: Lập trình cơ sở dữ liệu trong Python

Bài tập Python: Lập trình cơ sở dữ liệu trong Python

Tạo số ngẫu nhiên trong một phạm vi bằng Python

Tạo số ngẫu nhiên trong một phạm vi bằng Python

Bài tập Python : Tạo dữ liệu ngẫu nhiên trong Python

Bài tập Python : Tạo dữ liệu ngẫu nhiên trong Python

Bài tập Python : Matplotlib trong Python

Bài tập Python : Matplotlib trong Python

Bài tập Python: NumPy trong Python

Bài tập Python: NumPy trong Python

Bài tập Python: JSON trong Python

Bài tập Python: JSON trong Python

Bài tập Python: Lập trình hướng đối tượng (OOP) trong Python

Bài tập Python: Lập trình hướng đối tượng (OOP) trong Python

TimeDelta trong Python

TimeDelta trong Python

Chuyển chuỗi Python thành DateTime trong Python

Chuyển chuỗi Python thành DateTime trong Python

Bài tập Python: DateTime trong Python

Bài tập Python: DateTime trong Python

Bài tập Python: Tuple trong Python

Bài tập Python: Tuple trong Python

Bài tập Python: Set trong Python

Bài tập Python: Set trong Python

Bài tập Python: Dictionary trong Python

Bài tập Python: Dictionary trong Python

Bài tập Python: List trong Python

Bài tập Python: List trong Python

Bài tập Python: Cấu trúc dữ liệu trong Python

Bài tập Python: Cấu trúc dữ liệu trong Python

Bài tập Python: Chuỗi trong Python

Bài tập Python: Chuỗi trong Python

Top