Chào các anh em trong cộng đồng Sheet & Excel, đặc biệt là anh em mê Power BI!
Hôm nay mình muốn chia sẻ một kỹ thuật mà mình thấy rất hữu ích trong việc tối ưu hóa hiệu suất báo cáo Power BI, đặc biệt là với các tập dữ liệu lớn: Incremental Refresh (Làm mới dữ liệu tăng dần).
Trước đây, mỗi lần làm mới báo cáo là cả một quá trình chờ đợi. Với các bảng dữ liệu lên đến hàng triệu dòng, việc làm mới toàn bộ dữ liệu có thể mất hàng giờ đồng hồ, ảnh hưởng nghiêm trọng đến trải nghiệm người dùng và cả thời gian làm việc của chúng ta.
Incremental Refresh cho phép chúng ta chỉ làm mới các bản ghi mới hoặc đã thay đổi trong một khoảng thời gian nhất định, thay vì phải tải lại toàn bộ dữ liệu. Điều này giúp giảm đáng kể thời gian làm mới và tài nguyên hệ thống cần thiết.
Cách thức hoạt động cơ bản:
- Chúng ta cần tạo hai tham số ngày trong Power Query:
RangeStartvàRangeEnd. - Power BI sẽ tự động thiết lập các bộ lọc dựa trên hai tham số này để xác định phạm vi dữ liệu cần làm mới.
- Trong phần cài đặt của bảng dữ liệu trong Power BI Service, chúng ta cấu hình Incremental Refresh, chỉ định khoảng thời gian (ví dụ: 1 năm gần nhất) và chính sách lưu trữ dữ liệu lịch sử (ví dụ: giữ 2 năm).
Việc này đặc biệt hữu ích khi bạn làm việc với các nguồn dữ liệu có dung lượng lớn và tần suất cập nhật thường xuyên như SQL Server, Azure Synapse Analytics, hoặc thậm chí là các file CSV/Excel lớn được lưu trữ trên SharePoint/OneDrive.
Mình đã áp dụng thành công kỹ thuật này cho một báo cáo có dung lượng dữ liệu lên đến 50 triệu dòng và thời gian làm mới đã giảm từ 3 tiếng xuống chỉ còn khoảng 15 phút. Thực sự là một bước đột phá!
Anh em nào đã từng sử dụng Incremental Refresh cho báo cáo của mình thì chia sẻ thêm kinh nghiệm nhé. Còn ai chưa biết thì đây là một tính năng rất đáng để tìm hiểu và áp dụng đấy!