Chào các anh chị em trong diễn đàn,
Dạo này mình làm việc với nhiều file excel từ các nguồn khác nhau, và thường xuyên gặp phải tình trạng dữ liệu không được cấu trúc chuẩn. Kiểu như có những cột gộp lại, hoặc dữ liệu nằm ngang thay vì dọc, rất khó để phân tích hay dùng các hàm thông thường.
Gần đây, mình có mày mò và thấy Power Query là một công cụ cực kỳ mạnh mẽ để giải quyết vấn đề này. Nó giúp mình biến những bảng dữ liệu 'lộn xộn' thành cấu trúc 'sạch sẽ' chỉ trong vài phút.
Ví dụ điển hình là trường hợp dữ liệu dạng bảng, mà các bạn hay gặp khi xuất báo cáo từ một số phần mềm. Thay vì phải ngồi copy-paste thủ công, mình dùng Power Query để:
- Unpivot Columns: Biến các cột chứa giá trị thành 2 cột 'Attribute' (tên cột gốc) và 'Value' (giá trị).
- Pivot Columns: Ngược lại, biến các hàng thành cột nếu cần.
- Promote Headers: Tự động lấy hàng đầu tiên làm tiêu đề cột.
- Change Data Type: Chuẩn hóa kiểu dữ liệu cho từng cột.
Cách làm này không chỉ tiết kiệm thời gian mà còn giảm thiểu sai sót. Nếu ai đang 'vật lộn' với dữ liệu không theo cấu trúc, mình khuyên nên tìm hiểu về Power Query. Nó thực sự là 'cứu cánh' cho dân xử lý dữ liệu.
Có anh chị em nào có kinh nghiệm hay mẹo gì hay ho với Power Query trong việc cấu trúc dữ liệu không? Chia sẻ cho mọi người cùng học hỏi với ạ!