Dạo gần đây mình có tìm hiểu sâu hơn về Power Query và thực sự ấn tượng với khả năng của nó. Nếu bạn nào còn đang loay hoay với việc làm sạch, biến đổi và kết hợp dữ liệu thủ công trong Excel thì Power Query thực sự là một 'vị cứu tinh'.
Trước đây, mỗi lần nhận file dữ liệu về là một cực hình: định dạng lộn xộn, có dòng trống, có cột thừa, cần gom dữ liệu từ nhiều file khác nhau... Toàn bộ quá trình này tốn rất nhiều thời gian và dễ sai sót. Từ khi biết đến Power Query, mọi thứ trở nên nhẹ nhàng hơn hẳn.
Vậy Power Query là gì?
Nói nôm na, nó là một công cụ ETL (Extract, Transform, Load) tích hợp sẵn trong Excel (từ phiên bản 2016 trở lên, hoặc có thể tải về cho các phiên bản cũ hơn). Nó cho phép bạn:
- Kết nối dữ liệu từ nhiều nguồn khác nhau (Excel, CSV, Database, Web...).
- Làm sạch và biến đổi dữ liệu một cách trực quan qua giao diện, hoặc bằng ngôn ngữ M.
- Tải dữ liệu đã xử lý vào bảng tính Excel hoặc mô hình dữ liệu.
Điều tuyệt vời nhất là bạn có thể ghi lại các bước xử lý. Lần sau, chỉ cần nhấn nút Refresh, mọi thao tác sẽ được tự động lặp lại trên dữ liệu mới. Tiết kiệm thời gian và giảm thiểu sai sót tối đa.
Mình đang thử nghiệm một vài tác vụ như:
- Tự động gom dữ liệu từ hàng chục file Excel trong một thư mục.
- Tách cột họ tên thành 3 cột riêng biệt (Họ, Tên đệm, Tên).
- Lọc bỏ các dòng trống hoặc dòng có chứa chữ 'Tổng cộng'.
Nếu có ai quan tâm hoặc đã có kinh nghiệm dùng Power Query, chúng ta cùng thảo luận nhé! Chia sẻ cho nhau những mẹo hay, những hàm M hữu ích thì còn gì bằng.