Chào các anh em trong diễn đàn!
Dạo này mình có làm việc nhiều với Power BI và nhận ra một điều: chất lượng dữ liệu đầu vào quyết định rất lớn đến kết quả báo cáo. Nếu dữ liệu lộn xộn, nhiều lỗi thì dù có DAX xịn hay visual đẹp cũng khó mà ra được insight chuẩn.
Trong quá trình đó, mình tình cờ khám phá ra Power Query - một công cụ cực kỳ mạnh mẽ, tích hợp sẵn trong Excel và Power BI, giúp giải quyết vấn đề này một cách hiệu quả.
Trước đây, mình thường mất cả tiếng đồng hồ để lọc, xóa bỏ các dòng trống, sửa lỗi định dạng, tách cột, gộp cột thủ công trong Excel. Nhưng từ khi biết dùng Power Query, mọi thứ trở nên đơn giản hơn rất nhiều.
Một số tác vụ mà Power Query có thể giúp bạn:
- Loại bỏ các dòng hoặc cột trống.
- Xử lý các giá trị bị lặp lại.
- Tách hoặc gộp các cột dựa trên dấu phân cách.
- Chuyển đổi kiểu dữ liệu (văn bản, số, ngày tháng).
- Pivot/Unpivot dữ liệu.
- Kết hợp nhiều file Excel hoặc bảng dữ liệu khác nhau.
- Và còn vô vàn tác vụ khác nữa!
Điểm mình thích nhất là Power Query ghi lại toàn bộ các bước bạn thực hiện. Lần sau, chỉ cần nhấn nút Refresh là mọi thao tác sẽ được áp dụng tự động lên dữ liệu mới. Tiết kiệm thời gian và giảm thiểu sai sót tối đa.
Mình có làm một ví dụ nhỏ về việc làm sạch một bảng dữ liệu Excel có nhiều vấn đề. Các bạn có thể tham khảo sơ bộ tại đây (mình sẽ cập nhật link chi tiết hơn sau nếu có thời gian).
Có anh em nào đã dùng Power Query rồi, chia sẻ thêm kinh nghiệm hoặc các mẹo hay cho mọi người biết với nhé! Hoặc nếu ai đang gặp khó khăn với việc làm sạch dữ liệu, cứ mạnh dạn đặt câu hỏi, mình biết gì sẽ chia sẻ đó.