Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.
Reference Counting trong Python
Trong lập trình Python, hiểu biết về cơ chế tham chiếu và cách thức quản lý bộ nhớ là một phần quan trọng giúp bạn viết mã hiệu quả và tránh các lỗi phổ biến liên quan đến bộ nhớ. Tham chiếu (reference) trong Python không chỉ đơn thuần là gán giá trị cho biến, mà là quá trình liên kết biến với một đối tượng trong bộ nhớ. Việc nắm vững cách hoạt động của tham chiếu sẽ giúp bạn hiểu rõ hơn về quản lý đối tượng và bộ nhớ trong Python. Trong bài viết này, mình sẽ tìm hiểu chi tiết về cách thức hoạt động của tham chiếu và đếm số lượng tham chiếu trong Python, từ đó giúp bạn tối ưu hóa mã nguồn và quản lý tài nguyên hiệu quả hơn.
Giới thiệu về tham chiếu trong Python
Trong Python, biến không phải là nhãn của giá trị như bạn nghĩ. Thay vào đó, biến tham chiếu đến một đối tượng chứa giá trị. Nói cách khác, các biến là tham chiếu.
Ví dụ sau đây gán một số có giá trị là 100 cho một biến:
counter = 100
Đằng sau hậu trường, Python tạo ra một đối tượng số nguyên (int) mới trong bộ nhớ và liên kết biến counter
với địa chỉ bộ nhớ đó.
Bài viết này được đăng tại [free tuts .net]
Khi bạn truy cập biến counter
, Python sẽ tra cứu đối tượng được tham chiếu bởi counter
và trả về giá trị của đối tượng đó:
print(counter) # 100
Vì vậy, các biến là tham chiếu trỏ đến các đối tượng trong bộ nhớ.
Để tìm địa chỉ bộ nhớ của một đối tượng được tham chiếu bởi một biến, bạn truyền biến đó vào hàm id()
tích hợp.
Ví dụ sau đây trả về địa chỉ bộ nhớ của đối tượng số nguyên được tham chiếu bởi biến counter
:
counter = 100 print(id(counter))
Output:
140717671523072
Hàm id()
trả về địa chỉ bộ nhớ của một đối tượng được tham chiếu bởi một biến dưới dạng số hệ thập phân.
Để chuyển đổi địa chỉ bộ nhớ này thành chuỗi hệ thập lục phân, bạn sử dụng hàm hex()
:
counter = 100 print(id(counter)) print(hex(id(counter)))
Output:
140717671523072 0x7ffb62d32300
Đếm số lượng reference trong Python
Một đối tượng trong địa chỉ bộ nhớ có thể có một hoặc nhiều tham chiếu. Ví dụ:
counter = 100
Đối tượng số nguyên có giá trị là 100 có một tham chiếu là biến counter
. Nếu bạn gán counter
cho một biến khác, ví dụ max
:
counter = 100 max = counter
Bây giờ, cả hai biến counter
và max
đều tham chiếu đến cùng một đối tượng số nguyên. Đối tượng số nguyên có giá trị 100 có hai tham chiếu:
Nếu bạn gán một giá trị khác cho biến max
:
max = 999
... đối tượng số nguyên có giá trị 100 sẽ có một tham chiếu, đó là biến counter
.
Và số lượng tham chiếu của đối tượng số nguyên có giá trị 100 sẽ là zero nếu bạn gán một giá trị khác cho biến counter
:
counter = 1
Khi một đối tượng không có bất kỳ tham chiếu nào, Trình Quản lý Bộ Nhớ của Python sẽ hủy đối tượng đó và thu hồi bộ nhớ.
Đếm số lượng tham chiếu trong Python
Để lấy số lượng tham chiếu của một đối tượng, bạn sử dụng phương thức from_address()
của mô-đun ctypes
.
ctypes.c_long.from_address(address).value
Để sử dụng phương thức này, bạn cần truyền địa chỉ bộ nhớ của đối tượng mà bạn muốn đếm số lượng tham chiếu. Địa chỉ cũng cần là một số nguyên.
Đoạn mã sau định nghĩa một hàm gọi là ref_count()
sử dụng phương thức from_address()
:
import ctypes def ref_count(address): return ctypes.c_long.from_address(address).value
Bây giờ, bạn có thể sử dụng hàm ref_count()
ngắn gọn thay vì sử dụng cú pháp dài dòng như trên.
Ví dụ này định nghĩa một danh sách gồm ba số nguyên:
numbers = [1, 2, 3]
Để lấy địa chỉ bộ nhớ của danh sách numbers
, bạn sử dụng hàm id()
như sau:
numbers_id = id(numbers)
Đoạn mã sau đây hiển thị số lượng tham chiếu của danh sách được tham chiếu bởi biến numbers
:
print(ref_count(numbers_id)) # 1
Nó trả về một vì chỉ có biến numbers
tham chiếu đến danh sách.
Đoạn mã này gán biến numbers
cho một biến mới:
ranks = numbers
Số lượng tham chiếu của danh sách bây giờ là hai vì nó được tham chiếu bởi cả hai biến numbers
và ranks
:
print(ref_count(numbers_id)) # 2
Nếu bạn gán biến ranks
bằng None
, số lượng tham chiếu của danh sách sẽ giảm xuống một:
ranks = None print(ref_count(numbers_id)) # 1
Và nếu bạn gán biến numbers
bằng None
, số lượng tham chiếu của danh sách sẽ là zero:
numbers = None print(ref_count(numbers_id)) # 0
Tổng hợp tất cả:
import ctypes def ref_count(address): return ctypes.c_long.from_address(address).value numbers = [1, 2, 3] numbers_id = id(numbers) print(ref_count(numbers_id)) # 1 ranks = numbers print(ref_count(numbers_id)) # 2 ranks = None print(ref_count(numbers_id)) # 1 numbers = None print(ref_count(numbers_id)) # 0
Kết bài
Qua hướng dẫn này, bạn đã hiểu rõ hơn về cơ chế tham chiếu của biến trong Python, cách lấy địa chỉ bộ nhớ của đối tượng thông qua hàm id(), và cách đếm số lượng tham chiếu đến một đối tượng bằng hàm ref_count(). Những kiến thức này rất quan trọng trong việc quản lý bộ nhớ và tối ưu hóa hiệu suất của chương trình. Bằng cách nắm vững các khái niệm này, bạn sẽ có khả năng viết mã Python hiệu quả hơn, tránh được các lỗi liên quan đến bộ nhớ và làm chủ được việc quản lý tài nguyên trong các ứng dụng của mình.