Chào mọi người,
Dạo này mình hay gặp một dạng dữ liệu 'khó chịu' khi nhận từ bộ phận khác gửi sang, đó là dạng pivot table nhưng lại được copy-paste dưới dạng văn bản thuần túy, không phải là bảng pivot thực thụ. Điều này gây rất nhiều khó khăn trong việc xử lý và phân tích tiếp.
Cụ thể, dữ liệu trông như thế này:
Sản phẩm | Tháng 1 | Tháng 2 | Tháng 3 ---------------------------------------- Sữa chua | 100 | 120 | 150 Bánh mì | 50 | 60 | 75 Trái cây | 200 | 220 | 250
Khi copy paste vào Excel, nó thường dính liền nhau hoặc bị thụt lề lung tung, rất khó để tách ra thành các cột 'Sản phẩm', 'Tháng', 'Doanh số' để làm biểu đồ hay tính toán.
Mình đã thử các cách như Text to Columns với nhiều tùy chọn dấu phân cách khác nhau nhưng không ăn thua vì định dạng nó không nhất quán.
Gần đây, mình tình cờ tìm ra một cách khá hiệu quả bằng Power Query. Cách này giúp chuyển đổi dữ liệu 'lộn xộn' này thành dạng bảng chuẩn, dễ dàng làm việc.
Các bước cơ bản như sau:
- Load dữ liệu vào Power Query.
- Sử dụng chức năng Split Column (Tách cột) với các tùy chọn phù hợp, đôi khi cần kết hợp Replace Values (Thay thế giá trị) để làm sạch các ký tự thừa trước.
- Sau đó, dùng chức năng Unpivot Columns (Bỏ xoay cột) để đưa các cột tháng về dạng hàng.
- Cuối cùng, đổi tên cột và làm sạch dữ liệu là xong.
Cách này tuy hơi mất công vài bước đầu nhưng hiệu quả hơn hẳn so với việc sửa thủ công từng dòng, nhất là với file có nhiều dữ liệu.
Có anh em nào trong diễn đàn đã từng gặp trường hợp này và có cách xử lý nào khác hay hơn không? Chia sẻ cho mọi người cùng học hỏi nhé!