Chào mọi người,
Mình thường xuyên phải copy dữ liệu từ các trang web về Excel để xử lý. Tuy nhiên, đôi khi gặp phải những ký tự 'lạ' xuất hiện xen kẽ trong chuỗi văn bản, làm ảnh hưởng đến việc sử dụng hàm hoặc sắp xếp dữ liệu. Ví dụ như các ký tự không hiển thị, hoặc các ký tự đặc biệt mà mình không rõ nguồn gốc.
Sau một thời gian mày mò, mình tìm ra một cách khá hiệu quả để xử lý vấn đề này, hy vọng sẽ giúp ích được cho các bạn:
Cách 1: Sử dụng hàm SUBSTITUTE kết hợp với CHAR()
Thông thường, các ký tự lạ này có thể được biểu diễn bằng mã ASCII hoặc Unicode. Mình hay dùng hàm SUBSTITUTE để loại bỏ chúng. Đầu tiên, bạn cần xác định mã của ký tự lạ đó. Nếu không biết, có thể thử các mã phổ biến như CHAR(160) (khoảng trắng không ngắt dòng), CHAR(13) (xuống dòng), CHAR(10) (ngắt dòng)...
Ví dụ, nếu bạn muốn loại bỏ ký tự có mã 160 trong ô A1, bạn có thể dùng công thức:
=SUBSTITUTE(A1, CHAR(160), "")Bạn có thể lồng nhiều hàm SUBSTITUTE nếu có nhiều loại ký tự lạ.
Cách 2: Sử dụng Find & Replace với Wildcards
Nếu bạn không biết chính xác mã ký tự, hoặc chúng xuất hiện ngẫu nhiên, bạn có thể thử dùng chức năng Find & Replace.
1. Chọn vùng dữ liệu cần xử lý.
2. Nhấn Ctrl + H để mở hộp thoại Find & Replace.
3. Trong ô Find what, bạn có thể thử nhập một số ký tự lạ mà bạn thấy. Quan trọng là bạn cần tick vào ô Use wildcards.
4. Trong ô Replace with, để trống hoặc nhập ký tự bạn muốn thay thế.
5. Nhấn Replace All.
Cách này đôi khi cần thử nghiệm vài lần với các ký tự khác nhau để tìm ra ký tự cần loại bỏ.
Cách 3: Sử dụng Text to Columns
Đôi khi, các ký tự lạ này có thể được coi là dấu phân cách. Bạn có thể thử dùng Text to Columns:
1. Chọn cột dữ liệu.
2. Vào tab Data > Text to Columns.
3. Chọn Delimited.
4. Ở bước chọn dấu phân cách, thay vì chọn các dấu thông thường, bạn có thể thử nhập ký tự lạ vào ô Other (nếu có thể). Hoặc, nếu ký tự lạ đó làm dữ liệu bị tách thành nhiều cột không mong muốn, bạn có thể chọn Fixed width và căn chỉnh các đường kẻ để bỏ qua ký tự đó.
Mình hy vọng những cách trên sẽ giúp ích cho các bạn khi làm việc với dữ liệu copy từ web. Nếu ai có cách nào hay hơn, chia sẻ thêm để mọi người cùng học hỏi nhé!