Dạo này mình làm báo cáo với Excel 365 nhiều, mà mỗi lần nhận dữ liệu mới lại phải copy-paste rồi xử lý thủ công mệt quá. Tình cờ tìm hiểu thì thấy cái tính năng Get & Transform (hay còn gọi là Power Query) nó giải quyết được hết mấy vụ này.
Cái này hay lắm mọi người ạ, nó cho phép mình kết nối trực tiếp đến nhiều nguồn dữ liệu khác nhau như file Excel khác, CSV, database, thậm chí là web. Quan trọng nhất là nó có thể tự động hóa các bước làm sạch và biến đổi dữ liệu.
Ví dụ, mình có một file Excel chứa dữ liệu bán hàng mỗi ngày. Thay vì mỗi lần nhận file mới là lại lọc, xóa cột, đổi tên cột thủ công, mình chỉ cần thiết lập Power Query một lần. Sau đó, mỗi khi có file mới, mình chỉ cần vào Data > Refresh All là bảng tính tự động cập nhật dữ liệu mới nhất, đã được xử lý sạch sẽ luôn.
Các bước cơ bản mình hay dùng:
- Kết nối nguồn dữ liệu: Data > Get Data > Chọn nguồn phù hợp.
- Làm sạch và biến đổi: Dùng các tùy chọn trên tab Home hoặc Transform để loại bỏ dòng trống, sửa lỗi, đổi kiểu dữ liệu, tách cột, gộp cột...
- Tải dữ liệu: Close & Load để đưa dữ liệu đã xử lý vào bảng tính mới hoặc sheet hiện có.
Ai làm việc nhiều với dữ liệu, đặc biệt là dữ liệu