Chào mọi người,
Dạo gần đây mình có làm việc với một số báo cáo Power BI có lượng dữ liệu khá lớn, và nhận thấy thời gian làm mới (refresh) dữ liệu đôi khi kéo dài rất lâu, ảnh hưởng đến tiến độ công việc. Sau một thời gian tìm tòi và thử nghiệm, mình đã rút ra được một vài mẹo nhỏ để tối ưu hóa quá trình này.
Đầu tiên, hãy loại bỏ những cột và dòng không cần thiết ngay từ Power Query. Càng ít dữ liệu phải xử lý, tốc độ làm mới càng nhanh. Đừng ngại xóa đi những cột chỉ mang tính thông tin mà không phục vụ cho việc phân tích.
Thứ hai, tối ưu hóa các bước biến đổi dữ liệu (Transformations) trong Power Query. Hạn chế sử dụng các bước phức tạp hoặc có thể gộp lại. Ví dụ, thay vì chia một cột thành nhiều cột rồi lại gộp lại, hãy tìm cách xử lý trực tiếp.
Thứ ba, sử dụng các hàm DAX hiệu quả. Một công thức DAX được viết tốt có thể tạo ra sự khác biệt lớn về hiệu suất. Hãy ưu tiên các hàm có thể thực hiện phép tính trên toàn bộ bảng thay vì lặp qua từng dòng.
Cuối cùng, xem xét việc sử dụng DirectQuery thay vì Import nếu dữ liệu của bạn thay đổi liên tục và bạn cần thông tin cập nhật theo thời gian thực. Tuy nhiên, DirectQuery có thể làm chậm hiệu suất của báo cáo nếu nguồn dữ liệu không được tối ưu.
Hy vọng những chia sẻ này sẽ giúp ích cho các bạn trong quá trình làm việc với Power BI!