Chào mọi người,
Trong quá trình làm việc với Excel, chắc hẳn ai cũng từng gặp phải những file dữ liệu 'lộn xộn', không theo một cấu trúc nhất định, khiến việc phân tích và báo cáo trở nên vô cùng khó khăn. Hôm nay, mình muốn chia sẻ một bí quyết nhỏ nhưng cực kỳ hiệu quả để 'dọn dẹp' những mớ dữ liệu đó, đó là sử dụng Power Query.
Các file thường gặp có thể là:
- Dữ liệu bị gộp nhiều thông tin trong một ô.
- Các cột/hàng không đồng nhất về định dạng.
- Dữ liệu dạng 'bảng tin' (pivoted data) mà mình muốn chuyển về dạng bảng thông thường.
- Các báo cáo từ hệ thống phần mềm xuất ra với cấu trúc khó hiểu.
Thay vì mất hàng giờ đồng hồ để copy-paste, sắp xếp thủ công, Power Query sẽ giúp bạn làm điều này một cách tự động và nhanh chóng. Chỉ cần vài bước thiết lập ban đầu, sau này mỗi khi có dữ liệu mới, bạn chỉ cần nhấn Refresh là mọi thứ sẽ 'ngon lành' ngay.
Ví dụ, mình có một bảng dữ liệu mà thông tin khách hàng (Tên, Địa chỉ, Điện thoại) nằm chung trong một cột. Thay vì tách thủ công, mình dùng Power Query để:
- Tách cột đó thành các cột riêng biệt dựa trên dấu phân cách (ví dụ: dấu phẩy, dấu chấm phẩy).
- Chuẩn hóa định dạng (viết hoa đầu câu, bỏ khoảng trắng thừa).
- Đổi tên các cột cho dễ hiểu.
Sau đó, mình có thể dễ dàng tải dữ liệu đã được làm sạch này về lại Excel để tiếp tục phân tích hoặc tạo báo cáo.
Đây là một kỹ năng cực kỳ hữu ích, giúp tiết kiệm thời gian và giảm thiểu sai sót. Ai chưa quen Power Query thì nên tìm hiểu dần nhé, nó thực sự 'đáng đồng tiền bát gạo' đó!
Có ai có kinh nghiệm hay mẹo gì hay với Power Query trong việc xử lý cấu trúc dữ liệu thì chia sẻ thêm cho mọi người cùng học hỏi nhé!