Chào các bạn,
Dạo này mình hay gặp tình huống cần xử lý các chuỗi ký tự mà các phần tử được ngăn cách bởi nhiều loại dấu khác nhau, đôi khi còn lồng vào nhau. Ví dụ như chuỗi "Hà Nội, Việt Nam; Thành phố Hồ Chí Minh - Việt Nam". Việc dùng các hàm cũ như FIND, SEARCH, LEFT, RIGHT, MID kết hợp với nhau khá là phức tạp và dễ sai sót.
Gần đây, mình có khám phá ra hàm TEXTSPLIT mới của Excel (phiên bản Microsoft 365). Hàm này thực sự là một cứu cánh cho những bài toán xử lý chuỗi phức tạp. Nó cho phép chúng ta tách chuỗi dựa trên nhiều ký tự phân cách khác nhau, thậm chí là phân cách theo hàng hoặc theo cột.
Ví dụ với chuỗi trên, mình có thể dùng công thức:
=TEXTSPLIT("Hà Nội, Việt Nam; Thành phố Hồ Chí Minh - Việt Nam", {",";"-"})Kết quả trả về một mảng các chuỗi con được tách ra:
- Hà Nội
- Việt Nam
- Thành phố Hồ Chí Minh
- Việt Nam
Hoặc nếu muốn tách theo hàng:
=TEXTSPLIT("Hà Nội, Việt Nam; Thành phố Hồ Chí Minh - Việt Nam", ",", , TRUE)Kết quả sẽ là:
Hà NộiViệt NamThành phố Hồ Chí MinhViệt NamHàm này còn có nhiều tùy chọn khác như xử lý ô trống, bỏ qua ký tự rỗng... Rất tiện lợi cho việc chuẩn hóa và phân tích dữ liệu chuỗi. Các bạn đã thử dùng hàm này chưa? Có mẹo hay cách áp dụng nào khác thì chia sẻ thêm nhé!