Chào các bạn, mình là thành viên mới của diễn đàn. Hôm nay mình muốn chia sẻ một chút kinh nghiệm về cách xử lý dữ liệu trùng lặp trong Excel, một vấn đề mà mình thường xuyên gặp phải trong công việc.
Trước đây, mình thường dùng các bước thủ công như sắp xếp rồi lọc, hoặc dùng Conditional Formatting để tô màu. Tuy nhiên, với những file dữ liệu lớn, cách này khá tốn thời gian và dễ sai sót. Gần đây, mình có tìm hiểu và áp dụng một số phương pháp hiệu quả hơn, muốn chia sẻ để mọi người cùng tham khảo.
1. Sử dụng Remove Duplicates:
Đây là tính năng có sẵn trong Excel, rất nhanh chóng và tiện lợi. Bạn chỉ cần chọn vùng dữ liệu, vào tab Data, chọn Remove Duplicates. Tuy nhiên, cần lưu ý là tính năng này sẽ xóa vĩnh viễn các dòng trùng lặp, nên hãy sao lưu dữ liệu trước khi thực hiện.
2. Dùng Advanced Filter:
Advanced Filter cho phép bạn lọc ra các bản ghi duy nhất (Unique records) và copy chúng sang một vị trí khác mà không làm thay đổi dữ liệu gốc. Cách làm này linh hoạt hơn Remove Duplicates.
3. Kết hợp hàm COUNTIF và Filter:
Bạn có thể tạo một cột phụ sử dụng hàm =COUNTIF(A:A, A1) (với A là cột chứa dữ liệu bạn muốn kiểm tra trùng lặp). Sau đó, lọc ra những dòng có giá trị lớn hơn 1. Cách này giúp bạn xác định và đánh dấu các bản ghi trùng lặp mà không xóa chúng.
Ngoài ra, với những trường hợp phức tạp hơn, có thể kết hợp thêm PivotTable hoặc các công thức mảng. Tuy nhiên, 3 cách trên là đủ dùng cho đa số các tình huống thông thường.
Rất mong nhận được thêm chia sẻ từ các cao thủ Excel khác về chủ đề này!