Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.
Kiểu dữ liệu float trong Python
Trong lập trình Python, việc xử lý các số thực (floating-point numbers) đóng vai trò quan trọng trong nhiều ứng dụng, từ tính toán khoa học đến xử lý đồ họa. Python sử dụng lớp float
để biểu diễn các số thực, cho phép biểu diễn và thao tác với các giá trị dấu phẩy động một cách hiệu quả. Tuy nhiên, do cách Python và nhiều ngôn ngữ lập trình khác biểu diễn các số thực dưới dạng nhị phân, việc so sánh và tính toán chính xác các số dấu phẩy động đôi khi có thể gây ra những thách thức không ngờ tới. Trong bài viết này, mình sẽ tìm hiểu sâu về kiểu dữ liệu float
trong Python, cách Python biểu diễn các số thực, và các phương pháp kiểm tra tính bằng nhau của các số dấu phẩy động để tránh những sai lầm thường gặp.
Giới thiệu về kiểu dữ liệu float trong Python
Python sử dụng lớp float
để biểu diễn các số thực.
CPython triển khai float
bằng cách sử dụng kiểu double
trong C. Kiểu double
trong C thường triển khai IEEE 754 double-precision binary float, còn được gọi là binary64.
Kiểu float
trong Python sử dụng 8 byte (hoặc 64 bit) để biểu diễn các số thực. Khác với kiểu số nguyên, kiểu float
sử dụng số byte cố định.
Bài viết này được đăng tại [free tuts .net]
Về mặt kỹ thuật, Python sử dụng 64 bit như sau:
- 1 bit cho dấu (dương hoặc âm)
- 11 bit cho phần mũ (exponent), ví dụ: 1.5e-5 (phần mũ là -5), phạm vi là [-1022, 1023].
- 52 bit cho các chữ số có nghĩa (significant digits)
Để đơn giản, các chữ số có nghĩa là tất cả các chữ số ngoại trừ các số 0 đứng đầu và cuối.
Ví dụ, 0.25 có hai chữ số có nghĩa, 0.125 có ba chữ số có nghĩa, và 12.25 có bốn chữ số có nghĩa.
Một số số có biểu diễn nhị phân hữu hạn, nhưng một số thì không, ví dụ: 0.1. Trong nhị phân, nó là 01.0001100110011...
Do đó, Python chỉ có thể sử dụng biểu diễn gần đúng của các số float cho những số này.
Lớp float trong Python
Hàm float()
trả về một số dấu phẩy động dựa trên một số hoặc một chuỗi ký tự. Ví dụ:
>>> float(0.1) 0.1 >>> float('1.25') 1.25
Nếu bạn truyền một đối tượng (obj) cho float(obj)
, nó sẽ ủy thác cho obj.__float__()
. Nếu __float__()
không được định nghĩa, nó sẽ quay lại __index__()
.
Nếu bạn không truyền bất kỳ đối số nào cho float()
, nó sẽ trả về 0.0.
Khi bạn sử dụng hàm print()
, bạn sẽ thấy rằng số 0.1 được biểu diễn chính xác là 0.1. Tuy nhiên, bên trong, Python chỉ có thể biểu diễn 0.1 một cách gần đúng.
Để xem Python biểu diễn số 0.1 như thế nào bên trong, bạn có thể sử dụng hàm format()
.
Dưới đây là cách Python biểu diễn số 0.1 bằng 20 chữ số:
>>> format(0.1, '.20f') '0.10000000000000000555'
Như bạn thấy, 0.1 không phải là 0.1 chính xác mà là 0.10000000000000000555...
Do Python chỉ có thể biểu diễn một số float gần đúng, điều này sẽ gây ra nhiều vấn đề khi bạn so sánh hai số dấu phẩy động.
Kiểm tra tính bằng nhau
Hãy xem ví dụ sau:
x = 0.1 + 0.1 + 0.1 y = 0.3 print(x == y)
Kết quả:
False
Bên trong, Python không thể sử dụng một số hữu hạn các chữ số để biểu diễn các số x và y:
print(format(x, '.20f')) print(format(y, '.20f'))
Kết quả:
0.30000000000000004441 0.29999999999999998890
Lưu ý rằng số chữ số là vô hạn. Chúng tôi chỉ hiển thị 20 chữ số đầu tiên.
Một cách để giải quyết vấn đề này là làm tròn cả hai bên của biểu thức so sánh đến một số chữ số có nghĩa. Ví dụ:
x = 0.1 + 0.1 + 0.1 y = 0.3 print(round(x, 3) == round(y, 3))
Kết quả:
True
Tuy nhiên, giải pháp này không hoạt động trong tất cả các trường hợp.
PEP485 cung cấp một giải pháp khắc phục vấn đề này bằng cách sử dụng độ chính xác tương đối và tuyệt đối.
Nó cung cấp hàm isclose()
từ module math
trả về True
nếu hai số gần đúng với nhau.
Dưới đây là chữ ký của hàm isclose()
:
isclose(a, b, rel_tol=1e-9, abs_tol=0.0)
Ví dụ:
from math import isclose x = 0.1 + 0.1 + 0.1 y = 0.3 print(isclose(x,y))
Kết quả:
True
Kết bài
Python sử dụng lớp float
để biểu diễn các số thực, với các đặc tính và hạn chế nhất định do cách biểu diễn nhị phân. Khi làm việc với các số dấu phẩy động, hiểu rõ cách thức hoạt động và giới hạn của kiểu dữ liệu float
là vô cùng quan trọng để tránh các lỗi không mong muốn. Việc sử dụng các công cụ như hàm isclose()
từ module math
giúp kiểm tra tính bằng nhau của các số thực một cách chính xác hơn. Với những kiến thức này, bạn sẽ có thể xử lý các số thực trong Python một cách hiệu quả và chính xác hơn, đảm bảo tính toàn vẹn và độ tin cậy của các phép tính trong ứng dụng của mình.