Chào mọi người,
Dạo này mình đang làm một dự án liên quan đến việc tổng hợp dữ liệu khách hàng từ nhiều nguồn khác nhau. Vấn đề lớn nhất gặp phải là dữ liệu tên và địa chỉ của khách hàng bị nhập lung tung, không theo một chuẩn nào cả. Ví dụ: có chỗ ghi 'Nguyễn Văn A', có chỗ ghi 'Ng Van A', có chỗ ghi 'A, Nguyen Van', địa chỉ thì có nơi ghi 'Hà Nội', nơi ghi 'HN', nơi ghi 'Thành phố Hà Nội'.
Việc này gây khó khăn cực lớn khi mình muốn lọc, thống kê hay đối chiếu dữ liệu. Mình đã thử dùng các hàm Excel như PROPER, TRIM, SUBSTITUTE, nhưng để chuẩn hóa hết cho hàng nghìn dòng thì rất tốn thời gian và dễ sai sót.
Mình đang tìm kiếm một add-in nào đó có khả năng tự động hóa việc này. Kiểu như có thể cài đặt các quy tắc chuẩn hóa (ví dụ: luôn viết hoa chữ cái đầu mỗi tiếng, bỏ dấu tiếng Việt, chuẩn hóa tên tỉnh thành...) rồi cho add-in chạy một lần là xong.
Có anh em nào đã từng gặp vấn đề tương tự và tìm được giải pháp bằng add-in nào hiệu quả không ạ? Chia sẻ cho mình với. Hoặc nếu có add-in nào chuyên về xử lý dữ liệu văn bản, tên, địa chỉ thì giới thiệu luôn nhé.
Cảm ơn mọi người!