Chào các bạn, mình là dân văn phòng, công việc hàng ngày đụng độ Excel rất nhiều. Gần đây mình có tìm hiểu về Python để tự động hóa mấy tác vụ lặp đi lặp lại trên file Excel và thấy nó khá hay, muốn chia sẻ chút kinh nghiệm cho anh em nào mới bắt đầu giống mình.
Trước đây, mình cứ cặm cụi copy-paste, lọc dữ liệu thủ công, mất cả buổi trời. Từ khi biết đến Python với thư viện pandas, mọi thứ nhẹ nhàng hơn hẳn. Ví dụ, để đọc một file Excel và lọc ra những dòng có giá trị 'Hoàn thành' ở cột 'Trạng thái', mình chỉ cần vài dòng code:
import pandas as pd
df = pd.read_excel('du_lieu.xlsx')
du_lieu_hoan_thanh = df[df['Trạng thái'] == 'Hoàn thành']
print(du_lieu_hoan_thanh)
Thật sự là tiết kiệm thời gian kinh khủng! Ngoài ra, pandas còn có thể làm được rất nhiều thứ khác như:
- Ghi dữ liệu ra file Excel mới.
- Kết hợp dữ liệu từ nhiều file.
- Tính toán, thống kê dữ liệu.
- Thậm chí là tạo biểu đồ cơ bản.
Nếu bạn nào đang muốn tìm hiểu sâu hơn về tự động hóa Excel bằng Python, mình recommend bắt đầu với pandas. Có rất nhiều tutorial trên mạng, ví dụ như các bài viết về đọc file, xử lý dữ liệu với pandas mà các bạn khác đã chia sẻ trên diễn đàn này. Chúc các bạn thành công!