Chào mọi người,
Dạo này mình làm việc với một số file Excel mà dữ liệu ban đầu được trình bày hơi 'khó chịu', cụ thể là các cột thông tin đáng lẽ phải tách ra thì lại bị gộp chung vào một ô. Ví dụ, thay vì có 2 cột riêng là 'Tên' và 'Họ', thì lại gộp thành 1 cột 'Họ và Tên'. Việc này gây rất nhiều khó khăn khi cần phân tích hay sử dụng các hàm Excel thông thường.
Mình đã thử các cách thủ công như dùng chức năng 'Text to Columns' nhưng với dữ liệu lớn thì rất mất thời gian và dễ sai sót. Gần đây, mình có mày mò và thấy Power Query xử lý vụ này khá hiệu quả.
Cách mình làm là:
- Đầu tiên, load dữ liệu vào Power Query.
- Tìm cột chứa dữ liệu bị gộp.
- Sử dụng chức năng Split Column. Thay vì chọn theo dấu phân cách (delimiter) như thông thường, mình chọn tùy chọn By Number of Characters hoặc By Delimiter (nếu có dấu hiệu nhận biết).
- Trong trường hợp cột gộp có cấu trúc cố định, ví dụ 5 ký tự đầu là mã, phần còn lại là tên, mình sẽ chọn Split Column by Number of Characters và chỉ định số lượng ký tự.
- Nếu các thông tin bị gộp cách nhau bởi một ký tự đặc biệt nào đó mà mình có thể nhận diện (ví dụ: dấu gạch ngang, dấu chấm phẩy), mình sẽ chọn Split Column by Delimiter và nhập ký tự đó vào.
- Sau khi tách, Power Query thường tự động đặt tên cột mới là Column1, Column2,... Mình sẽ vào Rename để đặt lại tên cho các cột cho rõ ràng (ví dụ: Mã SP, Tên SP).
- Cuối cùng, chọn Close & Load To... để đưa dữ liệu đã xử lý về lại Excel.
Cách này giúp mình xử lý nhanh chóng, chính xác và quan trọng là có thể lặp lại quy trình nếu có dữ liệu mới tương tự. Hy vọng chia sẻ này hữu ích cho các bạn nào đang gặp vấn đề tương tự.
Có ai có cách nào hay hơn để xử lý dạng cột gộp này không, chia sẻ với mình nhé!