Hợp nhất hai khung dữ liệu và nối khung dữ liệu mới làm cột mới bằng Pandas trong Python
Trong bài viết này, mình sẽ tìm hiểu cách sử dụng thư viện Pandas trong Python để hợp nhất hai khung dữ liệu và nối một khung dữ liệu mới làm cột mới vào khung dữ liệu đầu tiên. Ta sẽ thực hiện từng bước theo hướng dẫn sau.
Bước 1: Import thư viện và tạo hai khung dữ liệu
Trước tiên,mình cần import thư viện Pandas và tạo hai khung dữ liệu từ hai từ điển khác nhau. Mỗi từ điển đại diện cho dữ liệu giá của các hãng ô tô và công suất máy của chúng.
import pandas as pd # Tạo từ điển cho giá của ô tô Car_Price = {'Company': ['Toyota', 'Honda', 'BMV', 'Audi'], 'Price': [23845, 17995, 135925, 71400]} carPriceDf = pd.DataFrame.from_dict(Car_Price) # Tạo từ điển cho công suất máy của ô tô car_Horsepower = {'Company': ['Toyota', 'Honda', 'BMV', 'Audi'], 'horsepower': [141, 80, 182, 160]} carsHorsepowerDf = pd.DataFrame.from_dict(car_Horsepower)
Bước 2: Hợp nhất hai khung dữ liệu
Mình sử dụng phương thức .merge()
để hợp nhất hai khung dữ liệu dựa trên một điều kiện chung, trong trường hợp này là cột "Company". Điều này giúp ta kết hợp thông tin giá và công suất máy của các hãng ô tô vào một khung dữ liệu duy nhất.
# Hợp nhất hai khung dữ liệu và nối khung dữ liệu mới làm cột mới carsDf = pd.merge(carPriceDf, carsHorsepowerDf, on="Company")
Bước 3: In kết quả
Cuối cùng, ta sẽ in kết quả, tức là khung dữ liệu cuối cùng sau khi đã hợp nhất hai khung dữ liệu và thêm cột công suất máy vào khung dữ liệu giá.
# In kết quả print("Python Pandas hợp nhất hai khung dữ liệu và nối khung dữ liệu mới làm cột mới:") print(carsDf)
Kết quả sẽ hiển thị khung dữ liệu cuối cùng với thông tin về giá và công suất máy của các hãng ô tô.
Kết quả
Dưới đây là kết quả mà bạn có thể mong đợi:
Python Pandas hợp nhất hai khung dữ liệu và nối khung dữ liệu mới làm cột mới: Company Price horsepower 0 Toyota 23845 141 1 Honda 17995 80 2 BMV 135925 182 3 Audi 71400 160
Qua bài viết trên đã sử dụng Pandas để hợp nhất hai khung dữ liệu dựa trên cột chung "Company" và thêm thông tin công suất máy vào khung dữ liệu giá của các hãng ô tô. Kết quả này giúp bạn quản lý và thao tác với dữ liệu từ nhiều nguồn khác nhau một cách dễ dàng bằng Pandas.
Bài giải
-------------------- ######## --------------------
Câu hỏi thường gặp liên quan:
- In năm hàng đầu tiên và cuối cùng từ file dữ liệu bằng Pandas trong Python
- Làm sạch file dữ liệu và cập nhật file CSV bằng Pandas trong Python
- Tìm tên hãng ô tô đắt nhất bằng Pandas trong Python
- In toàn bộ chi tiết xe Toyota bằng Pandas trong Python
- Đếm tổng số ô tô của mỗi công ty bằng Pandas trong Python
- Tìm giá xe Higesht của từng hãng bằng Pandas trong Python
- Tìm quãng đường đi được trung bình của mỗi hãng sản xuất ô tô bằng Pandas trong Python
- Sắp xếp tất cả các ô tô theo cột giá bằng Pandas trong Python
- Ghép hai khung dữ liệu và tạo khóa cho mỗi khung dữ liệu bằng Pandas trong Python
- Hợp nhất hai khung dữ liệu và nối khung dữ liệu mới làm cột mới bằng Pandas trong Python