Chào mọi người,
Dạo gần đây mình có làm việc với một số file báo cáo mà dữ liệu được trình bày theo dạng 'bảng tin' (Pivoted Data). Kiểu này nhìn thì dễ đọc cho người xem nhanh, nhưng lại rất khó để phân tích sâu hoặc tổng hợp thông tin. Ví dụ, thay vì có một dòng cho mỗi giao dịch với các cột như 'Ngày', 'Sản phẩm', 'Doanh số', thì nó lại trình bày thành các cột là 'Sản phẩm 1', 'Sản phẩm 2', ... và các hàng là ngày tháng.
Mình loay hoay mãi mới tìm ra cách xử lý hiệu quả bằng Power Query. Hôm nay chia sẻ lại với anh em nào cũng gặp tình huống tương tự.
Vấn đề: Dữ liệu dạng bảng tin, khó tổng hợp.
Giải pháp: Sử dụng Power Query để 'Unpivot' (chuyển vị) dữ liệu.
Các bước cơ bản như sau:
- Load dữ liệu vào Power Query.
- Chọn các cột KHÔNG muốn Unpivot (thường là cột chứa thông tin định danh như Ngày tháng, Khu vực...).
- Vào tab Transform, chọn Unpivot Columns -> Unpivot Other Columns.
- Lúc này, các cột cũ sẽ được gom vào 2 cột mới: 'Attribute' (tên cột cũ) và 'Value' (giá trị tương ứng).
- Đổi tên 2 cột này cho phù hợp (ví dụ: 'Sản phẩm', 'Doanh số').
- Có thể thêm các bước lọc, chuyển đổi kiểu dữ liệu nếu cần.
- Load dữ liệu đã xử lý về Excel.
Cách này giúp mình đưa dữ liệu về dạng 'dài' (Long Format), rất tiện cho việc lập Pivot Table, dùng hàm tính toán hoặc phân tích bằng các công cụ khác.
Anh em nào có kinh nghiệm xử lý dạng dữ liệu này bằng cách khác thì chia sẻ thêm nhé!