Chào mọi người,
Dạo này mình đang thử nghiệm dùng Python để xử lý dữ liệu trong Excel và thấy khá hiệu quả. Hôm nay mình muốn chia sẻ với mọi người một cách tự động hóa việc tạo Pivot Table bằng Python. Cái này rất tiện, nhất là khi mình cần tạo nhiều bảng tổng hợp với các cấu hình khác nhau hoặc khi dữ liệu nguồn thay đổi thường xuyên.
Thay vì phải click chuột thủ công để tạo Pivot Table mỗi lần, mình có thể viết một đoạn script Python để làm điều đó. Thư viện pandas và openpyxl (hoặc xlsxwriter) là những công cụ mình hay dùng.
Ví dụ, giả sử mình có một file Excel với dữ liệu bán hàng và muốn tạo Pivot Table để xem tổng doanh thu theo từng khu vực và từng sản phẩm. Thay vì làm thủ công, mình có thể dùng đoạn code như sau:
import pandas as pd
# Đọc dữ liệu từ file Excel
df = pd.read_excel('du_lieu_ban_hang.xlsx')
# Tạo Pivot Table
pivot_table = pd.pivot_table(df,
values='DoanhThu',
index='KhuVuc',
columns='SanPham',
aggfunc='sum')
# Ghi Pivot Table ra file Excel mới (hoặc ghi đè lên file cũ)
with pd.ExcelWriter('bao_cao_pivot.xlsx', engine='openpyxl') as writer:
pivot_table.to_excel(writer, sheet_name='TongHopDoanhThu')
Cách này giúp mình tiết kiệm rất nhiều thời gian và giảm thiểu sai sót. Mọi người đã thử dùng Python để tự động hóa việc tạo Pivot Table chưa? Có cách nào hay hơn hoặc có gặp khó khăn gì không, chia sẻ cho mình biết với nhé!