Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.
Tìm hiểu phương thức __hash__ trong Python
Trong bài viết này, bạn sẽ tìm hiểu cách sử dụng hàm hash() trong Python để tạo ra giá trị băm cho các đối tượng, cũng như cách ghi đè phương thức đặc biệt __hash__ trong một lớp tùy chỉnh. Điều này rất hữu ích khi bạn muốn cho phép các đối tượng của lớp tự định nghĩa có thể được sử dụng trong các cấu trúc dữ liệu như từ điển hoặc tập hợp, nơi yêu cầu các đối tượng phải có khả năng băm.

Giới thiệu về hàm hash() trong Python
Hãy bắt đầu với một ví dụ đơn giản.
Đầu tiên, định nghĩa lớp Person với hai thuộc tính name và age:
class Person:
def __init__(self, name, age):
self.name = name
self.age = age
Tiếp theo, tạo hai đối tượng của lớp Person:
Bài viết này được đăng tại [free tuts .net]
p1 = Person('John', 22)
p2 = Person('Jane', 22)
Sau đó, kiểm tra giá trị hash của hai đối tượng p1 và p2:
print(hash(p1)) print(hash(p2))
Kết quả đầu ra:
110373112736 110373572343
Hàm hash() nhận một đối tượng và trả về giá trị hash của nó dưới dạng một số nguyên. Khi bạn truyền một đối tượng vào hàm hash(), Python sẽ thực thi phương thức đặc biệt __hash__ của đối tượng đó.
Điều này có nghĩa là khi bạn gọi:
hash(p1)
Python sẽ gọi phương thức __hash__ của đối tượng p1:
p1.__hash__()
Mặc định, phương thức __hash__ sử dụng danh tính (identity) của đối tượng và phương thức __eq__ trả về True nếu hai đối tượng là giống nhau (cùng tham chiếu đến một vùng nhớ). Để thay đổi hành vi mặc định này, bạn có thể ghi đè cả hai phương thức __eq__ và __hash__.
Ghi đè phương thức __eq__ và __hash__ trong Python
Nếu một lớp ghi đè phương thức __eq__, các đối tượng của lớp đó sẽ không thể được băm (hashable). Điều này có nghĩa là bạn không thể sử dụng chúng trong các kiểu dữ liệu yêu cầu đối tượng phải có khả năng băm, ví dụ như từ điển (dictionary) hoặc tập hợp (set).
Ví dụ, lớp Person dưới đây đã ghi đè phương thức __eq__:
class Person:
def __init__(self, name, age):
self.name = name
self.age = age
def __eq__(self, other):
return isinstance(other, Person) and self.age == other.age
Khi bạn cố gắng sử dụng đối tượng Person trong một tập hợp, Python sẽ báo lỗi:
members = {
Person('John', 22),
Person('Jane', 22)
}
Lỗi:
TypeError: unhashable type: 'Person'
Lý do là khi bạn ghi đè phương thức __eq__, phương thức __hash__ mặc định sẽ được gán giá trị None. Nếu bạn cố gắng gọi hàm hash() trên đối tượng Person, Python sẽ báo lỗi:
hash(Person('John', 22))
Lỗi:
TypeError: unhashable type: 'Person'
Để khắc phục, bạn cần ghi đè cả phương thức __hash__:
class Person:
def __init__(self, name, age):
self.name = name
self.age = age
def __eq__(self, other):
return isinstance(other, Person) and self.age == other.age
def __hash__(self):
return hash(self.age)
Bây giờ, lớp Person có thể hỗ trợ so sánh dựa trên tuổi và có thể băm được. Bạn có thể sử dụng đối tượng Person trong các cấu trúc dữ liệu như từ điển hoặc tập hợp.
Đảm bảo giá trị băm không thay đổi trong Python
Để đối tượng Person hoạt động tốt trong các cấu trúc dữ liệu như từ điển, giá trị băm của đối tượng nên không thay đổi. Để làm điều này, bạn có thể biến thuộc tính age thành một thuộc tính chỉ đọc (read-only):
class Person:
def __init__(self, name, age):
self.name = name
self._age = age
@property
def age(self):
return self._age
def __eq__(self, other):
return isinstance(other, Person) and self.age == other.age
def __hash__(self):
return hash(self.age)

Các kiểu dữ liệu trong C ( int - float - double - char ...)
Thuật toán tìm ước chung lớn nhất trong C/C++
Cấu trúc lệnh switch case trong C++ (có bài tập thực hành)
ComboBox - ListBox trong lập trình C# winforms
Random trong Python: Tạo số random ngẫu nhiên
Lệnh cin và cout trong C++
Cách khai báo biến trong PHP, các loại biến thường gặp
Download và cài đặt Vertrigo Server
Thẻ li trong HTML
Thẻ article trong HTML5
Cấu trúc HTML5: Cách tạo template HTML5 đầu tiên
Cách dùng thẻ img trong HTML và các thuộc tính của img
Thẻ a trong HTML và các thuộc tính của thẻ a thường dùng