Chào mọi người, dạo này mình thấy nhiều bạn gặp khó khăn trong việc xử lý dữ liệu trùng lặp trong Excel, đặc biệt là khi làm việc với các file lớn. Vì vậy, mình tổng hợp lại một vài cách phổ biến và hiệu quả để mọi người tham khảo, hy vọng sẽ giúp ích cho công việc của các bạn.
1. Sử dụng Remove Duplicates:
- Đây là cách nhanh nhất để loại bỏ các dòng trùng lặp hoàn toàn.
- Chọn vùng dữ liệu cần xử lý, vào tab Data -> Remove Duplicates.
- Chọn các cột mà bạn muốn Excel kiểm tra sự trùng lặp.
2. Sử dụng Conditional Formatting để đánh dấu:
- Nếu bạn muốn giữ lại dữ liệu gốc và chỉ đánh dấu các dòng trùng lặp để xem xét.
- Chọn vùng dữ liệu, vào tab Home -> Conditional Formatting -> New Rule.
- Chọn Use a formula to determine which cells to format và nhập công thức:
=COUNTIF(A:A,A1)>1(với cột A là cột bạn muốn kiểm tra). - Chọn định dạng màu sắc mong muốn.
3. Sử dụng Advanced Filter để lọc và sao chép:
- Cách này cho phép bạn lọc ra các bản ghi duy nhất và sao chép chúng sang một vị trí khác.
- Vào tab Data -> Advanced.
- Chọn Copy to another location, nhập vùng dữ liệu, chọn vị trí đích và tick vào ô Unique records only.
Ngoài ra, với các trường hợp phức tạp hơn, bạn có thể kết hợp các hàm như COUNTIF, SUMPRODUCT hoặc sử dụng Power Query để xử lý hiệu quả hơn.
Mọi người có phương pháp nào hay hơn không, chia sẻ thêm để chúng ta cùng học hỏi nhé!