Đọc dữ liệu bán kem đánh răng mỗi tháng và hiển thị bằng biểu đồ phân tán trong Python
Trong bài viết này, mình sẽ cùng nhau tìm hiểu cách đọc dữ liệu bán kem đánh răng mỗi tháng từ một tệp CSV và sau đó trực quan hóa nó bằng biểu đồ phân tán. Bài tập này giúp bạn làm quen với việc sử dụng biểu đồ phân tán để thể hiện mối quan hệ giữa hai biến và tùy chỉnh biểu đồ bằng cách thêm lưới cốt truyện.
Biểu đồ phân tán sẽ trông như thế này:
Bước 1: Import thư viện Pandas và Matplotlib
Bắt đầu bằng việc import thư viện Pandas để làm việc với dữ liệu và thư viện Matplotlib để vẽ đồ thị.
import pandas as pd import matplotlib.pyplot as plt
Bước 2: Đọc dữ liệu từ file CSV
Sử dụng hàm pd.read_csv()
để đọc dữ liệu từ file CSV và lưu nó vào một DataFrame.
df = pd.read_csv("sales_data.csv")
Bước 3: Trích xuất dữ liệu bán kem đánh răng từ DataFrame
Sử dụng phương thức .tolist()
để chuyển cột dữ liệu thành danh sách.
monthList = df['month_number'].tolist() toothPasteSalesData = df['toothpaste'].tolist()
Bước 4: Vẽ biểu đồ phân tán
Sử dụng hàm plt.scatter()
để vẽ biểu đồ phân tán, trong đó trục x là tháng và trục y là số lượng đơn vị kem đánh răng đã bán.
plt.scatter(monthList, toothPasteSalesData, label='Dữ liệu bán kem đánh răng')
Bước 5: Cấu hình biểu đồ
Sử dụng các hàm plt.xlabel()
, plt.ylabel()
, plt.legend()
, plt.title()
và plt.xticks()
để cấu hình biểu đồ.
plt.xlabel('Số tháng') plt.ylabel('Số lượng đơn vị đã bán') plt.legend(loc='upper left') plt.title('Dữ liệu bán kem đánh răng') plt.xticks(monthList)
Bước 6: Thêm lưới cốt truyện và hiển thị biểu đồ
Sử dụng hàm plt.grid()
để thêm lưới cốt truyện với kiểu đường dạng "--", sau đó sử dụng plt.show()
để hiển thị biểu đồ đã vẽ.
plt.grid(True, linewidth=1, linestyle="--") plt.show()
Kết quả
Khi bạn chạy chương trình và đảm bảo rằng bạn đã có file CSV "sales_data.csv" trong cùng thư mục với mã nguồn của bạn, bạn sẽ nhận được biểu đồ phân tán thể hiện số lượng đơn vị kem đánh răng đã bán theo từng tháng:
Chúc mừng bạn đã thành công đọc dữ liệu bán kem đánh răng mỗi tháng và hiển thị nó bằng biểu đồ phân tán sử dụng Matplotlib và Pandas. Bài tập này giúp bạn làm quen với việc trực quan hóa mối quan hệ giữa các biến bằng biểu đồ phân tán và tùy chỉnh biểu đồ bằng cách thêm lưới cốt truyện. Chúc các bạn thành công và tiếp tục khám phá thế giới trực quan hóa dữ liệu!
Bài giải
-------------------- ######## --------------------
Câu hỏi thường gặp liên quan:
- Đọc tổng lợi nhuận của các tháng và thể hiện bằng đồ thị trong Python
- Lấy tổng lợi nhuận các tháng và biểu diễn đồ thị đường thẳng với thuộc tính Style bằng Python
- Đọc tất cả dữ liệu bán sản phẩm và hiển thị bằng biểu đồ nhiều dòng bằng Python
- Đọc dữ liệu bán kem đánh răng mỗi tháng và hiển thị bằng biểu đồ phân tán trong Python
- Đọc dữ liệu bán sản phẩm kem dưỡng da mặt và sữa rửa mặt và hiển thị bằng biểu đồ thanh trong Python
- Đọc số liệu bán xà phòng tắm của các tháng và thể hiện bằng biểu đồ thanh trong Python.
- Đọc tổng lợi nhuận mỗi tháng và hiển thị bằng biểu đồ để xem các khoảng lợi nhuận phổ biến nhất trong Python
- Tính tổng dữ liệu bán hàng năm ngoái của từng sản phẩm và hiển thị bằng biểu đồ tròn trong Python
- Đọc sữa rửa mặt xà phòng tắm các tháng và hiển thị bằng Subplot trong Python