Chào các bạn, trong quá trình làm việc với Excel, chắc hẳn ai cũng đôi lần gặp phải vấn đề dữ liệu bị trùng lặp. Việc này không chỉ gây khó khăn trong phân tích mà còn có thể dẫn đến sai sót không đáng có. Hôm nay, mình muốn chia sẻ một số cách hiệu quả để xử lý dữ liệu trùng lặp, hy vọng sẽ hữu ích cho mọi người.
1. Sử dụng tính năng Remove Duplicates:
Đây là cách nhanh nhất và đơn giản nhất. Bạn chỉ cần chọn vùng dữ liệu, vào tab Data, chọn Remove Duplicates. Excel sẽ tự động xóa các dòng trùng lặp dựa trên các cột bạn chọn.
2. Sử dụng Conditional Formatting để tô màu:
Nếu bạn muốn giữ lại tất cả dữ liệu nhưng vẫn nhận biết được các dòng trùng lặp, Conditional Formatting là lựa chọn tuyệt vời. Chọn vùng dữ liệu, vào Home -> Conditional Formatting -> Highlight Cells Rules -> Duplicate Values. Bạn có thể chọn kiểu tô màu tùy ý.
3. Sử dụng công thức kết hợp Advanced Filter:
Cách này hơi nâng cao hơn một chút nhưng cho phép bạn trích xuất danh sách duy nhất ra một vùng khác. Đầu tiên, bạn có thể dùng một cột phụ với công thức để đánh dấu các dòng trùng lặp, sau đó dùng Advanced Filter để lọc lấy các dòng không trùng.
Ví dụ công thức đánh dấu trùng lặp trong cột phụ (giả sử dữ liệu bắt đầu từ A2):
=COUNTIF($A$2:A2, A2)Nếu kết quả trả về lớn hơn 1, nghĩa là có trùng lặp.
Ngoài ra, các bạn có thể tham khảo thêm các hàm như UNIQUE (trong các phiên bản Excel mới) hoặc kết hợp INDEX, MATCH, COUNTIF để xử lý dữ liệu trùng lặp theo các tiêu chí phức tạp hơn.
Mọi người có phương pháp nào hay hơn, chia sẻ để cùng học hỏi nhé!