INTRODUCTION
FLOW CONTROL
FUNCTIONS
DATATYPES
OBJECT & CLASS
Bài tập Python: Lập trình hướng đối tượng (OOP) trong Python Lập trình hướng đối tượng trong Python Class Variables trong Python Tìm hiểu về Methods trong Python Cách sử dụng phương thức __init__() trong Python Các biến Instance trong Python Tìm hiểu về Class Attributes trong Python Hàm Static Methods trong Python Phương thức __str__ trong Python Phương thức __repr__ trong Python Phương thức eq trong Python Tìm hiểu phương thức __hash__ trong Python Phương thức __bool__ trong Python Phương thức del trong Python Tìm hiểu về lớp Property trong Python Tìm hiểu về nạp chồng toán tử trong Python Trình Decorator Property trong Python Thuộc tính chỉ đọc trong Python Thuộc tính Delete trong Python Sử dụng super() trong Python Sử dụng __slots__ trong Python Cách sử dụng Protocol trong Python Sử dụng Enum aliases và @enum.unique trong Python Tùy chỉnh và mở rộng lớp Enum trong Python Cách sử dụng hàm Auto() của Python Single Responsibility Principle trong Python Nguyên tắc Đóng-Mở trong Python Nguyên tắc thay thế Liskov - LSP trong Python Interface Segregation Principle - ISP trong Python. Nguyên tắc đảo ngược sự phụ thuộc trong Python Đa kế thừa trong Python Tìm hiểu về các lớp mixin trong Python Mô tả Descriptors trong Python Phân biệt Data Descriptor và Non-data Descriptor trong Python Phương thức __new__ trong Python Tìm hiểu về Class Type trong Python Lớp Metaclass trong Python Ví dụ sử dụng metaclass trong Python Tìm hiểu về decorator dataclass trong Python Tìm hiểu về các ngoại lệ trong Python Ngoại lệ Raise trong Python Sử dụng câu lệnh raise from trong Python Ngoại lệ tùy chỉnh trong Python Module trong Python Package trong Python Class trong Python Hàm khởi tạo trong Python Kế thừa trong Python Đa kế thừa trong Python Setter và Getter trong Python Override trong Python Interface trong Python Bài tập Python: Module và Class
ADVANCED TOPICS
BỔ SUNG
PYTHON CĂN BẢN
CÁC CHỦ ĐỀ
BÀI MỚI NHẤT
MỚI CẬP NHẬT

Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.

Kiểu dữ liệu Set trong Python

Trong bài này chúng ta sẽ tìm hiểu kiểu dữ liệu Set trong Python với các thao tác như: Cách khởi tạo Set, thêm hoặc xóa các thành phần tử ra khỏi Set, và các thao tác thường dùng trên Set.

test php

banquyen png
Bài viết này được đăng tại freetuts.net, không được copy dưới mọi hình thức.

Các kiểu dữ liệu trong Python quả thật rườm rà, tại sao có mảng, tuple rồi mà lại thêm kiểu tập hợp Set làm gì nữa? Cái gì cũng có lý do của nó các bạn ạ. Sau đây chúng ta sẽ tìm hiểu về Set nhé.

1. Set trong Python là gì?

Set trong Python là tập các phần tử dữ liệu không có thứ tự, mỗi phần tử là duy nhất (không trùng lặp) và phải bất biến (không thể thay đổi). Tuy nhiên chúng ta có thể thêm hoặc xóa các phần tử ra khỏi Set một cách dễ dàng.

Cú pháp

Sau đây là cú pháp tạo Set trong Python.

Bài viết này được đăng tại [free tuts .net]

my_set = {element_1, element_2, element_3, ...}

Trong đó mỗi element là một phần tử và có thể có thuộc nhiều kiểu dữ liệu khác nhau, không nhất thiết phải đồng nhất.

Vì các phần tử không thể thay đổi giá trị nên Set không cho phép lưu trữ kiểu List hoặc Dictionary.

Ví dụ
# Tập hợp set kiểu int
my_set = {1, 2, 3}
print(my_set)

# Tập hợp set đa dạng kiểu khác
my_set = {1.0, "Hello", (1, 2, 3)}
print(my_set)

Như bạn thấy, ở ví dụ đầu tiên thì mình truyền dữ liệu đơn giản, còn ở ví dụ thứ hai thì có thểm kiểu Tuple.

Ví dụ khác
# Set không chứa dữ liệu trùng nhau
# Như trong tập hợp này mình cố tình cho trùng giá trị 3
# Nhưng khi in ra thì nó chỉ lấy 1 số 3 mà thôi
my_set = {1,2,3,4,3,2}
print(my_set)
# Output: {1, 2, 3, 4}

# Set không thể chứa tập hợp có thể thay đổi như Dictionary và List
# Nên đoạn code này sẽ bị lỗi TypeError
# Do nó chứa mảng [3,4]
my_set = {1, 2, [3, 4]}
# TypeError: unhashable type: 'list'

# Ta có thể khởi tạo giá trị của set qua ...
# đối tượng Set() trong Python
# bằng cách truyền vào một list (array)
my_set = set([1,2,3,2])
print(my_set)
# Output: {1, 2, 3}

Ở ví dụ này mình đã cố tình truyền dữ liệu bị trùng và kết quả là nó lọc hết chỉ giữ lại 1 giá trị bị trùng mà thôi. Ở ví dụ cuối cùng là mình đã khởi tạo một Set từ List chứ không phải tạo phần tử Set chứa kiểu dữ liệu List đâu nhé, đừng nhầm lẫn đoạn đó.

Khởi tạo Set rỗng

Việc khởi tạo Set rỗng sẽ có chút nhầm lẫn, việc sử dụng cặp {} sẽ gây hiểu lầm với kiểu dữ liệu Dictionary, vì vậy để khởi tạo một Set rỗng thì nên sử dụng đối tượng Set() và không truyền bất kì đối số nào vào.

Ví dụ
# Khởi tạo bằng cặp {}
a = {}

# Kiểm tra kiểu dữ liệu thì nó là một dictionary
print(type(a))
# Output: <class 'dict'>

# Khởi tạo bằng set()
a = set()

# Kiểm tra kiểu dữ liệu thì là một Set
print(type(a))
# Output: <class 'set'>

2. Làm thế nào để thay đổi Set trong Python?

Set không phải là kiểu dữ liệu có chỉ mục nên việc truy xuất thông qua chỉ mục index là điều không thể. Tuy nhiên nó hỗ trợ một số phương thức giúp ban làm điều này.

  • add() dùng để thêm phần tử
  • update() dùng để cập nhật phần tử

Hãy đọc kỹ phần ví dụ dưới đây sẽ giúp bạn hiểu rõ hơn.

# Khởi tạo set my_set
my_set = {1,3}
print(my_set)

# Nếu bạn bỏ comment ở dòng 9,
# bạn set nhận một lỗi là
# TypeError: 'set' object does not support indexing

#my_set[0]

# Thêm một phần tử vào set
my_set.add(2)
print(my_set)
# Output: {1, 2, 3}

# Thêm nhiều phần tử vào Set, ta dùng mảng để chứa các phần tử đó
my_set.update([2,3,4])
print(my_set)
# Output: {1, 2, 3, 4}

# Cập nhật set bằng một list và set mới
# Nó sẽ duyệt và loại bỏ bớt giá trị trùng nhau
my_set.update([4,5], {1,6,8})
print(my_set)
# Output: {1, 2, 3, 4, 5, 6, 8}

Chạy lên kết quả sẽ như sau:

{1, 3}
{1, 2, 3}
{1, 2, 3, 4}
{1, 2, 3, 4, 5, 6, 8}

3. Làm sao để xóa phần tử ra khỏi Set trong Python

Để loại bỏ phần tử ra khỏi Set thì ta sử dụng hai phương thức discard()remove(). Cả hai đều có chung một mục đích, tuy nhiên điểm khác biệt là với discard() thì sẽ không sinh lỗi nếu giá trị cần xóa không tồn tại, còn remove() thì sẽ sinh lỗi.

Ví dụ dưới đây sẽ minh họa cho điều này:

# Khởi tạo my_set
my_set = {1, 3, 4, 5, 6}
print(my_set)

# Xóa phần tử có giá trị 4
my_set.discard(4)
print(my_set)
# Output: {1, 3, 5, 6}

# Xóa phần tử có giá trị 6
my_set.remove(6)
print(my_set)
# Output: {1, 3, 5}

# Xóa phần tử
# không tồn tại trong my_set
my_set.discard(2)
print(my_set)
# Output: {1, 3, 5} => Không bị lỗi

# Xóa một phần tử
# không tồn tại trong my_set
# thì sẽ bị lỗi, do dùng phương thức remove
my_set.remove(2)
# Output: KeyError: 2

Tương tự, chúng ta có thể xóa và trả về phần tử đã xóa bằng phươn thức pop(), hoặc xóa toàn bộ phần tử bằng phương thức clear().

# Khởi tạo my_set
my_set = set("HelloWorld")
print(my_set)
# Output: {'r', 'd', 'o', 'e', 'W', 'H', 'l'}

# pop một phần tử ngẫu nhiên
print(my_set.pop())
# Output: Tùy thuộc vào giá trị mà nó xóa mà in kết quả khác nhau

# pop thêm một phần tử ngẫu nhiên khác
my_set.pop()
print(my_set)
# Output: Cũng là random

# clear my_set, kết quả trả về Set rỗng
my_set.clear()
print(my_set)
#Output: set()

4. Các hành phép tập hợp của Set trong Python

Set có thể sử dụng với nhiều phép toán như liên kết, hợp, ... bằng cách sử dụng các toán tử và phương thức mà nó hỗ trợ sẵn.

Set union

Toán tử union kí hiệu là |, nó sẽ trả về hợp của hai Set

set union jpg

Ví dụ
# Khởi tạo set A và B
A = {1, 2, 3, 4, 5}
B = {4, 5, 6, 7, 8}

# Sử dụng toán tử union |
print(A | B)
# Output: {1, 2, 3, 4, 5, 6, 7, 8}

Set Intersection

Phép giao intersection ký hiệu là &, nó sẽ trả về phần giao của hai set

set intersection jpg

Ví dụ
# Khởi tạo set A và B
A = {1, 2, 3, 4, 5}
B = {4, 5, 6, 7, 8}

# Sử dụng toán tử &
print(A & B)
# Output: {4, 5}

Set Difference

Phép Difference kí hiệu là -, nó sẽ trả về các phần tử của A không có trong B

set difference jpg

Ví dụ
# Khởi tạo set A và B
A = {1, 2, 3, 4, 5}
B = {4, 5, 6, 7, 8}

# Sử dụng toán tử -
print(A - B)
# Output: {1, 2, 3}

Set Symmetric Difference

Toán tử Set Symmetric Difference kí hiệu là ^, Nó sẽ trả về phần tử A không có trong B và phần tử B không có trong A.

set symmetric difference jpg

Ví dụ
# Khởi tạo A và B
A = {1, 2, 3, 4, 5}
B = {4, 5, 6, 7, 8}

# Sử dụng toán tử ^
print(A ^ B)
# Output: {1, 2, 3, 6, 7, 8}

5. Các thao tác khác với Set trong Python

Bây giờ mình sẽ làm một vài ví dụ về các thao tác khác thường gặp trên Set, đây là những thao tác được sử dụng rất nhiều khi bạn làm việc với Python.

Kiểm tra phần tử tồn tại trong Set

Để kiểm tra một phần tử có tồn tại không trong Set thì ta sử dụng toán tử in, toán tử này được sử dụng khá nhiều, hầu như tất cả các loại dữ liệu đều có.

Ví dụ
# Khởi tạo my_set
my_set = set("apple")

# Kiểm tra xem 'a' có tồn tại trong set không
print('a' in my_set)
# Output: True

# Kiểm tra xem 'p' có tồn tại trong set không
print('p' not in my_set)
# Output: False

Lặp qua các phần tử của Set

Để lặp qua các phần tử của Set thì ta có thể sử dụng vòng lặp for, đây là vòng lặp được sử dụng nhiều nhất trong Python.

Ví dụ
for letter in set("apple"):
    print(letter)

# Result:
# p
# l
# a
# e

6. Lời kết

Như vậy là mình đã giới thiệu xong kiến thức cơ bản về tập hợp Set trong Python.

Bạn cần lưu ý rằng với Set thì không thể thay đổi giá trị của các phần tử, bản chất khi sử dụng phương thức update là bạn đã bổ sung các phần tử. Tuy nhiên bạn có thể thực hiện các thao tác xóa phần tử ra khỏi set

Cùng chuyên mục:

Cách lưu trữ và tải lại Models trong PyTorch

Cách lưu trữ và tải lại Models trong PyTorch

Tìm hiểu về TensorBoard với PyTorch

Tìm hiểu về TensorBoard với PyTorch

Học chuyển giao (Transfer Learning) trong PyTorch Beginner

Học chuyển giao (Transfer Learning) trong PyTorch Beginner

Hướng dẫn cơ bản mạng Nơ-ron Tích Chập (CNN) trong PyTorch

Hướng dẫn cơ bản mạng Nơ-ron Tích Chập (CNN) trong PyTorch

Mạng Nơ-Ron truyền thẳng (Feed Forward Neural Network) trong PyTorch

Mạng Nơ-Ron truyền thẳng (Feed Forward Neural Network) trong PyTorch

Tìm hiểu Activation Functions trong PyTorch

Tìm hiểu Activation Functions trong PyTorch

Softmax và Cross Entropy trong PyTorch Beginner

Softmax và Cross Entropy trong PyTorch Beginner

Dataset Transforms trong PyTorch Beginner

Dataset Transforms trong PyTorch Beginner

Dataset và DataLoader trong PyTorch Beginner

Dataset và DataLoader trong PyTorch Beginner

Hồi quy Logistic trong PyTorch Beginner

Hồi quy Logistic trong PyTorch Beginner

Hồi quy tuyến tính trong PyTorch Beginner

Hồi quy tuyến tính trong PyTorch Beginner

Training Pipeline trong PyTorch Beginner

Training Pipeline trong PyTorch Beginner

Sử dụng Gradient Descent với Autograd trong PyTorch

Sử dụng Gradient Descent với Autograd trong PyTorch

Hướng dẫn về Tensor cơ bản trong PyTorch

Hướng dẫn về Tensor cơ bản trong PyTorch

Hướng dẫn cài đặt PyTorch với Deep Learning

Hướng dẫn cài đặt PyTorch với Deep Learning

LDA (Linear Discriminant Analysis) trong Python

LDA (Linear Discriminant Analysis) trong Python

Thuật toán AdaBoost trong Python

Thuật toán AdaBoost trong Python

Thuật toán K-Means Clustering trong Python

Thuật toán K-Means Clustering trong Python

Triển khai PCA bằng Python

Triển khai PCA bằng Python

Triển khai thuật toán Random Forest bằng Python

Triển khai thuật toán Random Forest bằng Python

Top