Chào các bác, hôm nay em lại lên đây nhờ các cao nhân chỉ giáo một chút ạ. Em đang làm báo cáo tổng hợp dữ liệu từ nhiều nguồn, mà khổ nỗi cái cột tỉnh/thành phố nó cứ loạn xạ lên. Nào là 'Hà Nội', 'TP. Hà Nội', 'Hà Nội City', rồi 'Hồ Chí Minh', 'TP. Hồ Chí Minh', 'Sài Gòn'... nhìn mà đau đầu.
Em đã thử dùng VLOOKUP với một bảng chuẩn hóa, nhưng dữ liệu nguồn thì thay đổi liên tục, mà số lượng tỉnh/thành phố thì cũng kha khá, làm bảng tra cứu mệt quá.
Liệu có cách nào dùng Power Query để tự động chuẩn hóa cái cột này không ạ? Em muốn nó có thể xử lý được các trường hợp như:
- Thêm/bớt 'TP.', 'Tỉnh', 'Thành phố', 'City'
- Xử lý các tên viết tắt (VD: 'HCM' thành 'Hồ Chí Minh')
- Loại bỏ các ký tự thừa (VD: dấu chấm, dấu phẩy không cần thiết)
Em có thử tìm hiểu về hàm Text.Clean nhưng chưa thấy hiệu quả lắm. Có bác nào có kinh nghiệm xử lý vụ này bằng Power Query không ạ? Chia sẻ cho em xin ít kinh nghiệm hoặc hướng dẫn chi tiết với ạ. Em xin cám ơn!