Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.
Tìm hiểu Mô-đun statistics Trong Python
Mô-đun statistics là một công cụ mạnh mẽ và dễ sử dụng trong thư viện chuẩn của Python, hỗ trợ các phép tính thống kê cơ bản như trung bình, phương sai, và tương quan. Trong bài viết này, mình sẽ tìm hiểu các hàm chính của mô-đun này với ví dụ minh họa.

Tính giá trị trung bình và các thước đo trung tâm trong Python
Mô-đun statistics cung cấp các hàm hỗ trợ tính giá trị trung bình bao gồm:
- mean() - tính trung bình.
 - fmean() - tương tự 
mean(), nhưng nhanh hơn và luôn trả về giá trị kiểu float. - geometric_mean() - tính trung bình hình học.
 - harmonic_mean() - tính trung bình điều hòa, có thể dùng thêm trọng số.
 
Ví dụ:
import random
import statistics as st
numbers = [random.randint(1, 100) for _ in range(10)]
print("Danh sách ngẫu nhiên:", numbers)
print("Trung bình:", st.mean(numbers))
print("Trung bình nhanh:", st.fmean(numbers))
print("Trung bình hình học:", st.geometric_mean(numbers))
print("Trung bình điều hòa:", st.harmonic_mean(numbers))
Median và các thước đo trung tâm khác
Có bốn hàm hỗ trợ tính median:
Bài viết này được đăng tại [free tuts .net]
- median() - median cơ bản.
 - median_low() - trả về giá trị thấp hơn trong hai giá trị giữa.
 - median_high() - trả về giá trị cao hơn trong hai giá trị giữa.
 - median_grouped() - dùng cho dữ liệu nhóm.
 
Ví dụ:
numbers = sorted([random.randint(1, 100) for _ in range(10)])
print("Danh sách ngẫu nhiên:", numbers)
print("Median:", st.median(numbers))
print("Median thấp:", st.median_low(numbers))
print("Median cao:", st.median_high(numbers))
print("Median nhóm:", st.median_grouped(numbers))
Mode và Quantiles trong Python
mode() trả về giá trị xuất hiện nhiều nhất trong dãy số, còn multimode() trả về tất cả các mode.
quantiles() chia dữ liệu thành bốn phần.
Ví dụ:
numbers = [1, 1, 1, 2, 3, 3, 4, 4, 4, 5, 5]
print("Mode:", st.mode(numbers))
print("Multi Mode:", st.multimode(numbers))
Phương sai và độ lệch chuẩn
Có hai loại phương sai và độ lệch chuẩn:
- pvariance() và pstdev() tính toán cho tổng thể.
 - variance() và stdev() tính toán cho mẫu.
 
Ví dụ:
numbers = sorted([random.randint(1, 100) for _ in range(10)])
print("Phương sai tổng thể:", st.pvariance(numbers))
print("Độ lệch chuẩn tổng thể:", st.pstdev(numbers))
print("Phương sai mẫu:", st.variance(numbers))
print("Độ lệch chuẩn mẫu:", st.stdev(numbers))
Quan hệ giữa hai biến số
Ba hàm kiểm tra mối quan hệ giữa hai dãy số:
- covariance() - độ biến thiên chung giữa hai dãy.
 - correlation() - hệ số tương quan Pearson.
 - linear_regression() - tính độ dốc và hệ số chặn.
 
Ví dụ:
x = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
y = [10, 9, 8, 7, 6, 5, 4, 3, 2, 1]
print("Độ hiệp phương sai:", st.covariance(x, y))
print("Hệ số tương quan:", st.correlation(x, y))
slope, intercept = st.linear_regression(x, y)
print("Độ dốc:", slope, "Hệ số chặn:", intercept)
Kết bài
Mô-đun statistics trong Python hỗ trợ rất nhiều phép tính thống kê cơ bản và có thể thay thế cho các thư viện bên thứ ba trong các trường hợp đơn giản. Đây là công cụ hiệu quả để thực hiện các phép tính thống kê mà không cần phải cài thêm thư viện phức tạp.

            Các kiểu dữ liệu trong C ( int - float - double - char ...)        
            Thuật toán tìm ước chung lớn nhất trong C/C++        
            Cấu trúc lệnh switch case trong C++ (có bài tập thực hành)        
            ComboBox - ListBox trong lập trình C# winforms        
            Random trong Python: Tạo số random ngẫu nhiên        
            Lệnh cin và cout trong C++        
                Cách khai báo biến trong PHP, các loại biến thường gặp            
                Download và cài đặt Vertrigo Server            
                Thẻ li trong HTML            
                Thẻ article trong HTML5            
                Cấu trúc HTML5: Cách tạo template HTML5 đầu tiên            
                Cách dùng thẻ img trong HTML và các thuộc tính của img            
                Thẻ a trong HTML và các thuộc tính của thẻ a thường dùng