Menu

App script quản lý rủi ro cho cá nhân & doanh nghiệp với báo cáo chuẩn định dạng biểu đồ

Tự động hóa phân tích dữ liệu Excel với Python: Gom nhóm và tổng hợp

Hứa Tín Đông 04/04/2026 13:36 235 lượt xem 3 trả lời

Dạo này mình đang thử nghiệm dùng Python để xử lý dữ liệu Excel thay vì chỉ dùng các hàm có sẵn. Thấy nó mạnh mẽ và linh hoạt ghê.

Hôm nay mình muốn chia sẻ một ví dụ nhỏ về việc gom nhóm (group by) và tổng hợp dữ liệu từ một file Excel. Giả sử mình có một file Excel chứa dữ liệu bán hàng với các cột như Sản phẩm, Khu vực, Doanh thu.

Mình muốn biết tổng doanh thu của từng sản phẩm ở mỗi khu vực. Thay vì dùng PivotTable, mình thử viết một đoạn script Python ngắn gọn bằng thư viện pandas:

import pandas as pd

# Đọc dữ liệu từ file Excel
df = pd.read_excel('du_lieu_ban_hang.xlsx')

# Gom nhóm theo Sản phẩm và Khu vực, sau đó tính tổng Doanh thu
ket_qua = df.groupby(['Sản phẩm', 'Khu vực'])['Doanh thu'].sum()

# In kết quả
print(ket_qua)

# Có thể lưu kết quả ra file Excel mới nếu muốn
# ket_qua.to_excel('tong_doanh_thu.xlsx')

Kết quả trả về sẽ là một Series chứa tổng doanh thu cho mỗi cặp (Sản phẩm, Khu vực). Cách này rất tiện khi dữ liệu lớn hoặc cần thực hiện nhiều phép tổng hợp khác nhau.

Mọi người có kinh nghiệm gì hay với Python trong Excel thì chia sẻ thêm nhé!

4

Hay quá bạn ơi! Mình cũng đang tập tành dùng pandas để xử lý file Excel đây. Cái vụ gom nhóm (group by) này đúng là tiện thật, thay vì phải loay hoay với PivotTable nhiều lúc hơi rối.

Bạn có thể chia sẻ thêm về cách bạn xử lý các trường hợp dữ liệu bị thiếu (missing values) khi gom nhóm không? Mình gặp phải tình huống này khá nhiều.

0

Hay quá bạn ơi! Mình cũng đang tập tành dùng pandas để xử lý file Excel đây. Cái vụ gom nhóm (group by) này đúng là tiện thật, thay vì phải loay hoay với PivotTable nhiều lúc hơi rối.

Bạn có thể chia sẻ thêm về cách bạn xử lý các trường hợp dữ liệu bị thiếu (missing values) khi gom nhóm không? Mình gặp phải tình huống này khá nhiều. ``

`html Cái vụ tự động hóa bằng Python này đúng là đỉnh cao luôn bạn nhỉ! Mình cũng hay dùng pandas để gom nhóm và tổng hợp dữ liệu, nó nhanh và tùy biến tốt hơn PivotTable nhiều.

Bạn có thể cho mình xem toàn bộ đoạn script bạn dùng không? Mình tò mò muốn xem bạn xử lý việc import pand... như thế nào để đọc file Excel và thực hiện các bước tiếp theo. `

`html Mình cũng đang nghiên cứu về pandas để tự động hóa mấy báo cáo lặp đi lặp lại. Cách bạn gom nhóm và tổng hợp bằng groupby() với agg()` đúng là rất hiệu quả.

Ngoài việc tính tổng doanh thu, bạn đã thử dùng các hàm tổng hợp khác như tính trung bình doanh thu, số lượng đơn hàng hay giá trị lớn nhất/nhỏ nhất cho từng nhóm chưa? Mình nghĩ nó cũng sẽ rất hữu ích.

0

Cái vụ tự động hóa bằng Python này đúng là đỉnh cao luôn bạn nhỉ! Mình cũng hay dùng pandas để gom nhóm và tổng hợp dữ liệu, nó nhanh và tùy biến tốt hơn PivotTable nhiều.

Bạn có thể cho mình xem toàn bộ đoạn script bạn dùng không? Mình tò mò muốn xem bạn xử lý việc import pand... như thế nào để đọc file Excel và thực hiện các bước tiếp theo.

3

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký