Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.
Tìm hiểu Mô-đun statistics Trong Python
Mô-đun statistics
là một công cụ mạnh mẽ và dễ sử dụng trong thư viện chuẩn của Python, hỗ trợ các phép tính thống kê cơ bản như trung bình, phương sai, và tương quan. Trong bài viết này, mình sẽ tìm hiểu các hàm chính của mô-đun này với ví dụ minh họa.
Tính giá trị trung bình và các thước đo trung tâm trong Python
Mô-đun statistics
cung cấp các hàm hỗ trợ tính giá trị trung bình bao gồm:
- mean() - tính trung bình.
- fmean() - tương tự
mean()
, nhưng nhanh hơn và luôn trả về giá trị kiểu float. - geometric_mean() - tính trung bình hình học.
- harmonic_mean() - tính trung bình điều hòa, có thể dùng thêm trọng số.
Ví dụ:
import random import statistics as st numbers = [random.randint(1, 100) for _ in range(10)] print("Danh sách ngẫu nhiên:", numbers) print("Trung bình:", st.mean(numbers)) print("Trung bình nhanh:", st.fmean(numbers)) print("Trung bình hình học:", st.geometric_mean(numbers)) print("Trung bình điều hòa:", st.harmonic_mean(numbers))
Median và các thước đo trung tâm khác
Có bốn hàm hỗ trợ tính median:
Bài viết này được đăng tại [free tuts .net]
- median() - median cơ bản.
- median_low() - trả về giá trị thấp hơn trong hai giá trị giữa.
- median_high() - trả về giá trị cao hơn trong hai giá trị giữa.
- median_grouped() - dùng cho dữ liệu nhóm.
Ví dụ:
numbers = sorted([random.randint(1, 100) for _ in range(10)]) print("Danh sách ngẫu nhiên:", numbers) print("Median:", st.median(numbers)) print("Median thấp:", st.median_low(numbers)) print("Median cao:", st.median_high(numbers)) print("Median nhóm:", st.median_grouped(numbers))
Mode và Quantiles trong Python
mode() trả về giá trị xuất hiện nhiều nhất trong dãy số, còn multimode() trả về tất cả các mode.
quantiles() chia dữ liệu thành bốn phần.
Ví dụ:
numbers = [1, 1, 1, 2, 3, 3, 4, 4, 4, 5, 5] print("Mode:", st.mode(numbers)) print("Multi Mode:", st.multimode(numbers))
Phương sai và độ lệch chuẩn
Có hai loại phương sai và độ lệch chuẩn:
- pvariance() và pstdev() tính toán cho tổng thể.
- variance() và stdev() tính toán cho mẫu.
Ví dụ:
numbers = sorted([random.randint(1, 100) for _ in range(10)]) print("Phương sai tổng thể:", st.pvariance(numbers)) print("Độ lệch chuẩn tổng thể:", st.pstdev(numbers)) print("Phương sai mẫu:", st.variance(numbers)) print("Độ lệch chuẩn mẫu:", st.stdev(numbers))
Quan hệ giữa hai biến số
Ba hàm kiểm tra mối quan hệ giữa hai dãy số:
- covariance() - độ biến thiên chung giữa hai dãy.
- correlation() - hệ số tương quan Pearson.
- linear_regression() - tính độ dốc và hệ số chặn.
Ví dụ:
x = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] y = [10, 9, 8, 7, 6, 5, 4, 3, 2, 1] print("Độ hiệp phương sai:", st.covariance(x, y)) print("Hệ số tương quan:", st.correlation(x, y)) slope, intercept = st.linear_regression(x, y) print("Độ dốc:", slope, "Hệ số chặn:", intercept)
Kết bài
Mô-đun statistics
trong Python hỗ trợ rất nhiều phép tính thống kê cơ bản và có thể thay thế cho các thư viện bên thứ ba trong các trường hợp đơn giản. Đây là công cụ hiệu quả để thực hiện các phép tính thống kê mà không cần phải cài thêm thư viện phức tạp.