Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.
Tìm hiểu phương thức __hash__ trong Python
Trong bài viết này, bạn sẽ tìm hiểu cách sử dụng hàm hash()
trong Python để tạo ra giá trị băm cho các đối tượng, cũng như cách ghi đè phương thức đặc biệt __hash__
trong một lớp tùy chỉnh. Điều này rất hữu ích khi bạn muốn cho phép các đối tượng của lớp tự định nghĩa có thể được sử dụng trong các cấu trúc dữ liệu như từ điển hoặc tập hợp, nơi yêu cầu các đối tượng phải có khả năng băm.
Giới thiệu về hàm hash()
trong Python
Hãy bắt đầu với một ví dụ đơn giản.
Đầu tiên, định nghĩa lớp Person
với hai thuộc tính name
và age
:
class Person: def __init__(self, name, age): self.name = name self.age = age
Tiếp theo, tạo hai đối tượng của lớp Person
:
Bài viết này được đăng tại [free tuts .net]
p1 = Person('John', 22) p2 = Person('Jane', 22)
Sau đó, kiểm tra giá trị hash của hai đối tượng p1
và p2
:
print(hash(p1)) print(hash(p2))
Kết quả đầu ra:
110373112736 110373572343
Hàm hash()
nhận một đối tượng và trả về giá trị hash của nó dưới dạng một số nguyên. Khi bạn truyền một đối tượng vào hàm hash()
, Python sẽ thực thi phương thức đặc biệt __hash__
của đối tượng đó.
Điều này có nghĩa là khi bạn gọi:
hash(p1)
Python sẽ gọi phương thức __hash__
của đối tượng p1
:
p1.__hash__()
Mặc định, phương thức __hash__
sử dụng danh tính (identity) của đối tượng và phương thức __eq__
trả về True
nếu hai đối tượng là giống nhau (cùng tham chiếu đến một vùng nhớ). Để thay đổi hành vi mặc định này, bạn có thể ghi đè cả hai phương thức __eq__
và __hash__
.
Ghi đè phương thức __eq__
và __hash__
trong Python
Nếu một lớp ghi đè phương thức __eq__
, các đối tượng của lớp đó sẽ không thể được băm (hashable). Điều này có nghĩa là bạn không thể sử dụng chúng trong các kiểu dữ liệu yêu cầu đối tượng phải có khả năng băm, ví dụ như từ điển (dictionary) hoặc tập hợp (set).
Ví dụ, lớp Person
dưới đây đã ghi đè phương thức __eq__
:
class Person: def __init__(self, name, age): self.name = name self.age = age def __eq__(self, other): return isinstance(other, Person) and self.age == other.age
Khi bạn cố gắng sử dụng đối tượng Person
trong một tập hợp, Python sẽ báo lỗi:
members = { Person('John', 22), Person('Jane', 22) }
Lỗi:
TypeError: unhashable type: 'Person'
Lý do là khi bạn ghi đè phương thức __eq__
, phương thức __hash__
mặc định sẽ được gán giá trị None
. Nếu bạn cố gắng gọi hàm hash()
trên đối tượng Person
, Python sẽ báo lỗi:
hash(Person('John', 22))
Lỗi:
TypeError: unhashable type: 'Person'
Để khắc phục, bạn cần ghi đè cả phương thức __hash__
:
class Person: def __init__(self, name, age): self.name = name self.age = age def __eq__(self, other): return isinstance(other, Person) and self.age == other.age def __hash__(self): return hash(self.age)
Bây giờ, lớp Person
có thể hỗ trợ so sánh dựa trên tuổi và có thể băm được. Bạn có thể sử dụng đối tượng Person
trong các cấu trúc dữ liệu như từ điển hoặc tập hợp.
Đảm bảo giá trị băm không thay đổi trong Python
Để đối tượng Person
hoạt động tốt trong các cấu trúc dữ liệu như từ điển, giá trị băm của đối tượng nên không thay đổi. Để làm điều này, bạn có thể biến thuộc tính age
thành một thuộc tính chỉ đọc (read-only):
class Person: def __init__(self, name, age): self.name = name self._age = age @property def age(self): return self._age def __eq__(self, other): return isinstance(other, Person) and self.age == other.age def __hash__(self): return hash(self.age)