Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.
Tìm hiểu về decorator dataclass trong Python
Trong lập trình Python, việc quản lý và tổ chức dữ liệu là một trong những nhiệm vụ quan trọng nhất. Để đơn giản hóa việc tạo ra các lớp chứa dữ liệu, Python đã giới thiệu một công cụ mạnh mẽ gọi là dataclass kể từ phiên bản 3.7. Dataclass cho phép lập trình viên định nghĩa các lớp với cấu trúc rõ ràng và ít mã hơn, đồng thời tự động cung cấp các phương thức như khởi tạo, so sánh, và biểu diễn chuỗi cho các đối tượng. Điều này không chỉ giúp tiết kiệm thời gian trong quá trình phát triển mà còn làm cho mã nguồn trở nên dễ hiểu và bảo trì hơn. Trong bài viết này, bạn sẽ tìm kiế cách sử dụng decorator dataclass để xây dựng các lớp dữ liệu hiệu quả và linh hoạt, từ đó cải thiện quy trình làm việc của bạn trong Python.
Giới thiệu về dataclass trong Python
Python đã giới thiệu dataclass trong phiên bản 3.7 (PEP 557). Dataclass cho phép bạn định nghĩa các lớp với ít mã hơn nhưng lại có nhiều tính năng hơn ngay từ ban đầu.
Dưới đây là một lớp Person
thông thường với hai thuộc tính: name
và age
:
class Person: def __init__(self, name, age): self.name = name self.age = age
Lớp Person
này có phương thức __init__
dùng để khởi tạo các thuộc tính name
và age
.
Bài viết này được đăng tại [free tuts .net]
Nếu bạn muốn có một cách biểu diễn đối tượng Person
dưới dạng chuỗi (ví dụ khi in ra), bạn cần phải tự viết phương thức __str__
hoặc __repr__
. Tương tự, nếu muốn so sánh hai đối tượng Person
dựa trên thuộc tính, bạn cần phải tự triển khai phương thức __eq__
.
Tuy nhiên, khi sử dụng dataclass, bạn sẽ có tất cả các tính năng này (và nhiều hơn nữa) mà không cần phải tự viết những phương thức đặc biệt như vậy.
Làm sao để biến lớp thành dataclass?
Để biến lớp Person
thành một dataclass, bạn thực hiện các bước sau:
Bước 1: Import decorator dataclass
từ module dataclasses
:
from dataclasses import dataclass
Bước 2: Thêm decorator @dataclass
vào trước định nghĩa của lớp và khai báo các thuộc tính:
@dataclass class Person: name: str age: int
Trong ví dụ này, lớp Person
có hai thuộc tính: name
với kiểu dữ liệu str
và age
với kiểu dữ liệu int
. Khi làm như vậy, decorator @dataclass
sẽ tự động tạo ra phương thức __init__
cho lớp với cấu trúc như sau:
def __init__(name: str, age: int):
Lưu ý rằng thứ tự khai báo các thuộc tính trong lớp sẽ quyết định thứ tự của các tham số trong phương thức __init__
.
Giờ đây, bạn có thể tạo đối tượng Person
như sau:
p1 = Person('John', 25)
Khi in ra đối tượng Person
, bạn sẽ nhận được một chuỗi hiển thị dễ đọc:
print(p1)
Kết quả:
Person(name='John', age=25)
Ngoài ra, khi so sánh hai đối tượng Person
có cùng giá trị thuộc tính, bạn sẽ nhận được kết quả là True
. Ví dụ:
p1 = Person('John', 25) p2 = Person('John', 25) print(p1 == p2)
Kết quả:
True
Các tính năng khác mà dataclass cung cấp trong Python
Giá trị mặc định
Khi sử dụng lớp thông thường, bạn có thể định nghĩa các giá trị mặc định cho thuộc tính. Ví dụ, lớp Person
dưới đây có thuộc tính iq
với giá trị mặc định là 100
:
class Person: def __init__(self, name, age, iq=100): self.name = name self.age = age self.iq = iq
Trong dataclass, bạn có thể định nghĩa giá trị mặc định cho thuộc tính bằng cách gán giá trị đó trực tiếp cho thuộc tính:
from dataclasses import dataclass @dataclass class Person: name: str age: int iq: int = 100 print(Person('John Doe', 25))
Kết quả:
Person(name='John Doe', age=25, iq=100)
Tương tự như khi định nghĩa tham số trong phương thức, các thuộc tính có giá trị mặc định phải được khai báo sau những thuộc tính không có giá trị mặc định. Do đó, đoạn mã sau sẽ không hoạt động:
@dataclass class Person: iq: int = 100 name: str age: int
Chuyển đổi đối tượng thành tuple hoặc dictionary
Module dataclasses
cung cấp các hàm astuple()
và asdict()
để chuyển một đối tượng dataclass thành tuple hoặc dictionary. Ví dụ:
from dataclasses import dataclass, astuple, asdict @dataclass class Person: name: str age: int iq: int = 100 p = Person('John Doe', 25) print(astuple(p)) print(asdict(p))
Kết quả:
('John Doe', 25, 100) {'name': 'John Doe', 'age': 25, 'iq': 100}
Tạo đối tượng bất biến (immutable)
Để tạo các đối tượng không thể thay đổi sau khi khởi tạo, bạn có thể sử dụng tham số frozen=True
khi khai báo dataclass. Ví dụ:
from dataclasses import dataclass @dataclass(frozen=True) class Person: name: str age: int iq: int = 100
Nếu bạn cố gắng thay đổi giá trị của một thuộc tính sau khi đối tượng được khởi tạo, Python sẽ báo lỗi. Ví dụ:
p = Person('Jane Doe', 25) p.iq = 120
Kết quả:
dataclasses.FrozenInstanceError: cannot assign to field 'iq'
Tùy chỉnh hành vi của thuộc tính
Nếu bạn không muốn khởi tạo một thuộc tính trong phương thức __init__
, bạn có thể sử dụng hàm field()
từ module dataclasses
.
Ví dụ sau định nghĩa thuộc tính can_vote
không được khởi tạo trong phương thức __init__
:
from dataclasses import dataclass, field @dataclass class Person: name: str age: int iq: int = 100 can_vote: bool = field(init=False)
Hàm field()
có nhiều tham số hữu ích như repr
, hash
, compare
, và metadata
.
Nếu bạn muốn khởi tạo một thuộc tính phụ thuộc vào giá trị của thuộc tính khác, bạn có thể sử dụng phương thức __post_init__
. Phương thức này sẽ được gọi ngay sau khi phương thức __init__
hoàn thành.
Ví dụ dưới đây sử dụng __post_init__
để khởi tạo thuộc tính can_vote
dựa trên giá trị của thuộc tính age
:
from dataclasses import dataclass, field @dataclass class Person: name: str age: int iq: int = 100 can_vote: bool = field(init=False) def __post_init__(self): print('called __post_init__ method') self.can_vote = 18 <= self.age <= 70 p = Person('Jane Doe', 25) print(p)
Kết quả:
called __post_init__ method Person(name='Jane Doe', age=25, iq=100, can_vote=True)
Sắp xếp đối tượng
Theo mặc định, dataclass sẽ tự động triển khai phương thức __eq__
(so sánh bằng).
Để cho phép các loại so sánh khác như __lt__
(bé hơn), __lte__
(bé hơn hoặc bằng), __gt__
(lớn hơn), và __gte__
(lớn hơn hoặc bằng), bạn có thể thiết lập tham số order=True
cho decorator @dataclass
:
@dataclass(order=True) class Person: ...
Bằng cách này, dataclass sẽ sắp xếp các đối tượng dựa trên tất cả các thuộc tính cho đến khi tìm thấy một giá trị không bằng nhau.
Trong thực tế, bạn thường muốn so sánh các đối tượng dựa trên một thuộc tính cụ thể chứ không phải tất cả. Để làm điều đó, bạn cần định nghĩa một trường sort_index
và gán giá trị của nó bằng thuộc tính bạn muốn sắp xếp.
Ví dụ: giả sử bạn có một danh sách các đối tượng Person
và muốn sắp xếp chúng theo tuổi (age
):
members = [ Person('John', 25), Person('Bob', 35), Person('Alice', 30) ]
Kết bài
Như vậy, thông qua hướng dẫn này, bạn đã tìm hiểu về cách sử dụng decorator dataclass trong Python để tạo ra các lớp dữ liệu hiệu quả và linh hoạt. Việc sử dụng dataclass không chỉ giúp bạn tiết kiệm thời gian trong việc viết mã mà còn đảm bảo rằng mã của bạn rõ ràng và dễ hiểu hơn. Với các tính năng mạnh mẽ như tự động tạo phương thức khởi tạo, so sánh, và biểu diễn chuỗi, dataclass đã trở thành một công cụ hữu ích cho các lập trình viên Python. Hãy thử áp dụng những kiến thức này vào các dự án của bạn để tối ưu hóa quy trình phát triển và cải thiện chất lượng mã nguồn. Với dataclass, việc làm việc với dữ liệu trong Python trở nên dễ dàng và hiệu quả hơn bao giờ hết.