Dạo gần đây mình có tìm hiểu về Power Query và thực sự ấn tượng với những gì nó có thể làm được. Nếu anh em nào còn đang 'vật lộn' với việc làm sạch, biến đổi, kết hợp dữ liệu từ nhiều nguồn khác nhau trong Excel thì đây là một add-in cực kỳ hữu ích mà các bạn nên biết.
Power Query (giờ được tích hợp sẵn trong Excel 2016 trở lên và có tên là 'Get & Transform') giúp tự động hóa các tác vụ xử lý dữ liệu lặp đi lặp lại. Thay vì phải copy-paste, dùng hàm, hay viết VBA, giờ đây bạn có thể thực hiện mọi thứ qua giao diện trực quan của Power Query.
Power Query làm được gì?
- Kết nối dữ liệu từ rất nhiều nguồn: File Excel, CSV, Folder, Database (SQL Server, Access...), Web, SharePoint, v.v.
- Làm sạch dữ liệu: Loại bỏ dòng trống, sửa lỗi định dạng, đổi tên cột, tách/gộp cột, thay thế giá trị...
- Biến đổi dữ liệu: Chuyển đổi kiểu dữ liệu, xoay bảng (unpivot/pivot), thêm cột tùy chỉnh...
- Kết hợp dữ liệu: Ghép nhiều bảng lại với nhau (merge), nối nhiều bảng (append).
- Tự động hóa: Sau khi thiết lập các bước xử lý, chỉ cần nhấn Refresh là dữ liệu sẽ được cập nhật theo đúng các bước đó. Rất tiện lợi cho việc làm báo cáo định kỳ.
Ví dụ đơn giản, thay vì dùng các hàm phức tạp để nối 2 bảng Excel dựa trên một cột chung, bạn chỉ cần dùng chức năng 'Merge Queries' trong Power Query. Nó trực quan và dễ hiểu hơn rất nhiều.
Các bước xử lý trong Power Query được ghi lại dưới dạng các 'Applied Steps', bạn có thể xem lại, chỉnh sửa hoặc xóa bỏ bất kỳ bước nào một cách dễ dàng. Điều này giúp việc sửa lỗi hoặc thay đổi logic xử lý trở nên đơn giản hơn bao giờ hết.
Anh em nào đã dùng Power Query rồi thì chia sẻ thêm kinh nghiệm nhé. Còn ai chưa biết thì mình khuyên chân thành nên tìm hiểu về nó, đảm bảo sẽ 'tiết kiệm' được rất nhiều thời gian và công sức làm việc với Excel.