Dạo gần đây mình thấy nhiều anh em hỏi về cách xử lý dữ liệu bị trùng. Đúng là trong quá trình làm việc với Excel, việc gặp phải dữ liệu trùng lặp là không thể tránh khỏi, gây ra nhiều phiền toái và sai sót trong phân tích. Vì vậy, hôm nay mình xin tổng hợp lại một số cách hiệu quả để nhận diện và loại bỏ dữ liệu trùng, hy vọng sẽ giúp ích cho mọi người.
1. Sử dụng Conditional Formatting để tô màu
- Chọn vùng dữ liệu cần kiểm tra.
- Vào tab Home -> Conditional Formatting -> Highlight Cells Rules -> Duplicate Values.
- Chọn kiểu định dạng và nhấn OK. Cách này giúp bạn dễ dàng nhìn thấy các ô chứa dữ liệu trùng.
2. Sử dụng Remove Duplicates
- Chọn vùng dữ liệu.
- Vào tab Data -> Remove Duplicates.
- Chọn các cột mà bạn muốn kiểm tra trùng lặp và nhấn OK. Excel sẽ tự động xóa các hàng bị trùng dựa trên lựa chọn của bạn. Lưu ý, cách này sẽ xóa vĩnh viễn dữ liệu trùng, nên hãy sao lưu trước khi thực hiện.
3. Sử dụng Advanced Filter
- Chọn vùng dữ liệu.
- Vào tab Data -> Advanced.
- Trong hộp thoại Advanced Filter, chọn Copy to another location.
- Tại mục List range, chọn vùng dữ liệu của bạn.
- Tại mục Criteria range, bạn có thể để trống nếu chỉ muốn lọc duy nhất.
- Tại mục Copy to, chọn một ô trống để đặt kết quả.
- Quan trọng: Tick vào ô Unique records only.
- Nhấn OK. Kết quả sẽ là một danh sách duy nhất, không trùng lặp.
Ngoài ra, các bạn có thể kết hợp với các hàm như COUNTIF để đếm số lần xuất hiện của một giá trị, từ đó xác định dữ liệu trùng. Mong rằng những tổng hợp này sẽ giúp các bạn xử lý dữ liệu hiệu quả hơn.