Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.
Ý nghĩa của một hoặc hai dấu gạch dưới đứng đầu trong Python
Trong Python, các dấu gạch dưới không chỉ đơn thuần là ký tự, mà còn mang ý nghĩa quan trọng trong việc xác định phạm vi truy cập và quản lý biến. Dù Python không sử dụng các từ khóa public
, private
, hay protected
như một số ngôn ngữ khác, nhưng nhờ vào một và hai dấu gạch dưới đứng đầu trong tên biến, lập trình viên có thể tạo ra những quy ước rõ ràng để quản lý quyền truy cập và tránh xung đột trong mã nguồn. Bài viết này sẽ giúp bạn hiểu rõ cách số lượng dấu gạch dưới ảnh hưởng đến khả năng truy cập của các biến và ý nghĩa thực tiễn của chúng trong việc xây dựng các lớp và phương thức trong Python.
Python và các mức độ truy cập trong Python
Python không có các từ khóa xác định quyền truy cập như public
, private
, và protected
như một số ngôn ngữ lập trình khác. Thay vào đó, Python sử dụng dấu gạch dưới như một cách thay thế để chỉ định giới hạn truy cập giả lập.
Trong bài viết này, chúng ta sẽ tìm hiểu cách sử dụng một và hai dấu gạch dưới đứng đầu trong tên biến để quản lý truy cập.
Một dấu gạch dưới (Single Leading Underscore)
Biến được khai báo trong lớp với một dấu gạch dưới đứng đầu thường được xem là biến "riêng tư" (private) theo quy ước, nhưng điều này chỉ mang tính chất gợi ý, không có ràng buộc về mặt ngôn ngữ.
Bài viết này được đăng tại [free tuts .net]
Cách hoạt động:
- Bên trong lớp: Các IDE như PyCharm sẽ cảnh báo nếu bạn sử dụng biến này ngoài phạm vi lớp, nhưng Python không ngăn chặn truy cập.
- Khi import: Nếu sử dụng cú pháp
from module import *
, Python sẽ không import các đối tượng có tên bắt đầu bằng một dấu gạch dưới.
Ví dụ:
class Sample: def __init__(self): self.foo = "lorem" self._bar = "ipsum" s = Sample() print(s.foo) # Truy cập bình thường print(s._bar) # Truy cập được nhưng không được khuyến khích
Kết quả:
lorem ipsum
Ghi chú:
- Python không áp đặt giới hạn truy cập đối với biến _bar, nhưng theo quy ước, biến này được coi là dành cho sử dụng nội bộ.
- IDE có thể cảnh báo nếu biến này được sử dụng ngoài phạm vi lớp.
Hai dấu gạch dưới (Double Leading Underscore)
Biến với hai dấu gạch dưới đứng đầu được Python xử lý đặc biệt thông qua một cơ chế gọi là "Name Mangling". Điều này giúp Python đổi tên biến để tránh xung đột khi có nhiều lớp sử dụng cùng tên biến.
Cách hoạt động:
- Tên biến được đổi thành dạng:
_<tên_lớp>__<tên_biến>
- Khi import: Các biến bắt đầu bằng hai dấu gạch dưới không được import khi sử dụng cú pháp
from module import *
.
Ví dụ:
class Sample: def __init__(self): self.foo = "hello" self.__bar = "world" s = Sample() print(dir(s))
Kết quả:
['_Sample__bar', ..., 'foo']
Truy cập biến sau khi Name Mangling
class Sample: def __init__(self): self.foo = "hello" self.__bar = "world" s = Sample() print(s.foo) # Truy cập bình thường print(s.__bar) # Lỗi: AttributeError print(s._Sample__bar) # Truy cập được nhờ tên mới
Kết quả:
s.foo
: Truy cập bình thường.s.__bar
: Gây lỗi vì biến__bar
đã được đổi tên.s._Sample__bar
: Truy cập được thông qua tên sau khi đổi.
Ghi chú:
- Dù biến có hai dấu gạch dưới được coi là "riêng tư thực sự" ("real private"), bạn vẫn có thể truy cập nó bằng cách sử dụng tên được đổi.
- Cơ chế này chủ yếu nhằm tránh xung đột tên biến khi làm việc với nhiều lớp.
Hai dấu gạch dưới đứng đầu và đứng cuối (Double Leading and Trailing Underscores)
Tên với hai dấu gạch dưới đứng đầu và đứng cuối được Python dành riêng cho các phương thức và thuộc tính đặc biệt (Magic Methods hoặc Special Methods).
Ví dụ phổ biến:
__init__
: Hàm khởi tạo của lớp.__str__
: Trả về chuỗi đại diện của đối tượng.__repr__
: Trả về chuỗi biểu diễn chính thức của đối tượng.__del__
: Được gọi khi một đối tượng bị xóa.
Ví dụ:
class Sample: def __init__(self, name): self.name = name def __str__(self): return f"Sample object with name: {self.name}" s = Sample("Python") print(s)