Chào mọi người,
Mình thường xuyên phải làm việc với các file dữ liệu mà các cột thông tin được phân tách bằng nhiều loại dấu khác nhau, ví dụ có lúc là dấu phẩy (,), có lúc là dấu chấm phẩy (;), hoặc thậm chí là dấu gạch đứng (|). Việc này gây khó khăn khi mình muốn tách các giá trị này thành các cột riêng biệt bằng các hàm Excel thông thường như Text to Columns.
Gần đây, mình có tìm hiểu và áp dụng Power Query để xử lý vấn đề này, và thấy nó khá hiệu quả. Cách làm của mình là:
- Đầu tiên, mình tải dữ liệu vào Power Query.
- Sau đó, mình sử dụng chức năng 'Split Column' nhưng thay vì chọn một dấu phân cách cố định, mình chọn 'By Delimiter'.
- Trong hộp thoại 'By Delimiter', mình chọn 'Custom' và nhập một biểu thức thông thường (regular expression) để nhận diện tất cả các dấu phân cách có thể có. Ví dụ, mình có thể dùng
[,;|]để nhận diện dấu phẩy, chấm phẩy, hoặc gạch đứng. - Power Query sẽ tự động tách chuỗi dựa trên các dấu phân cách đã định nghĩa.
Cách này giúp mình tiết kiệm rất nhiều thời gian so với việc phải xử lý thủ công hoặc dùng các công thức phức tạp. Không biết có anh em nào có cách xử lý khác hay hơn không, chia sẻ để mọi người cùng học hỏi nhé!