Dạo này mình hay phải copy dữ liệu từ các trang web về Excel để làm báo cáo. Tuy nhiên, dữ liệu copy về thường bị dính định dạng, khoảng trắng thừa, hoặc có những ký tự lạ nhìn rất khó chịu. Dùng tay xóa từng cái thì mất thời gian quá.
Hôm nay, mình chia sẻ một vài mẹo nhỏ mà mình hay dùng để xử lý nhanh gọn đống dữ liệu này, hy vọng giúp ích được cho các bạn:
- Xử lý khoảng trắng thừa: Dùng hàm
TRIM()là cách kinh điển rồi. Tuy nhiên, nếu muốn nhanh hơn, sau khi paste dữ liệu vào Excel, bạn có thể chọn vùng dữ liệu, vào tab Data -> Text to Columns. Chọn Delimited, nhấn Next, chọn Space làm dấu phân cách, nhấn Next rồi Finish. Thường thì cách này sẽ tách các từ ra, bạn có thể xóa cột thừa hoặc dùng lạiTRIM()nếu cần. Một cách khác là dùng tính năng Find and Replace (Ctrl+H), tìm kiếm 2 hoặc nhiều khoảng trắng liên tiếp và thay thế bằng 1 khoảng trắng. - Xóa ký tự không mong muốn: Nếu có các ký tự đặc biệt hay ký tự lạ, bạn có thể dùng hàm
CLEAN()để loại bỏ các ký tự không in được. Nếu muốn xóa một ký tự cụ thể, ví dụ dấu phẩy (,) hay dấu chấm (.), bạn cũng có thể dùng Find and Replace. - Tách dữ liệu bị dính: Đôi khi dữ liệu copy về bị dính liền nhau trong một ô. Bạn có thể dùng Text to Columns như đã nói ở trên, hoặc dùng các hàm như
LEFT(),RIGHT(),MID()kết hợp vớiFIND()hoặcSEARCH()để tách chúng ra tùy theo cấu trúc dữ liệu.
Các bạn còn mẹo nào hay hơn không? Chia sẻ thêm cho mọi người cùng học hỏi nhé!