Chào mọi người,
Dạo gần đây mình làm việc với một file Excel mà dữ liệu ngày tháng nó 'loạn cào cào' luôn. Có khi thì là DD/MM/YYYY, có khi lại là MM/DD/YYYY, rồi có những ô còn bị thiếu cả năm. Xử lý thủ công thì mất thời gian mà dễ sai sót quá. May mắn là mình đã tìm ra cách dùng Power Query để tự động 'dọn dẹp' mớ bòng bong này.
Về cơ bản, mình sẽ dùng các bước sau:
- Bước 1: Load dữ liệu vào Power Query. Chọn vùng dữ liệu, vào tab Data -> From Table/Range.
- Bước 2: Chuẩn hóa định dạng ngày tháng. Với cột chứa ngày tháng, mình sẽ vào tab Transform -> Data Type -> Date. Power Query thường sẽ tự nhận diện được các định dạng phổ biến.
- Bước 3: Xử lý trường hợp thiếu năm (nếu có). Nếu vẫn còn ô báo lỗi hoặc định dạng chưa đúng sau Bước 2, mình sẽ dùng hàm
Date.YearvàDate.FromTextkết hợp với các điều kiện logic. Ví dụ, nếu phát hiện ngày tháng chỉ có 2 ký tự cuối năm, mình sẽ thêm '20' vào trước. - Bước 4: Chuyển đổi về định dạng mong muốn. Sau khi đã chuẩn hóa, mình có thể chọn định dạng ngày tháng cuối cùng mình cần.
Cách này giúp mình tiết kiệm rất nhiều thời gian và đảm bảo tính nhất quán cho dữ liệu. Có ai đã từng gặp trường hợp tương tự và có cách xử lý nào khác hiệu quả hơn không? Chia sẻ cho mọi người cùng học hỏi nhé!