Chào mọi người, dạo này mình làm việc với nhiều file Excel có dữ liệu khá lớn, và vấn đề dữ liệu trùng lặp cứ hay xuất hiện. Xử lý chúng vừa tốn thời gian, vừa dễ sai sót. Hôm nay mình muốn tổng hợp lại một vài cách mà mình hay dùng để xử lý vấn đề này, hy vọng sẽ giúp ích cho các bạn.
Đầu tiên là cách đơn giản nhất: Highlight các ô trùng lặp.
- Chọn vùng dữ liệu cần kiểm tra.
- Vào Home -> Conditional Formatting -> Highlight Cells Rules -> Duplicate Values.
- Chọn kiểu định dạng mong muốn và nhấn OK.
Cách này giúp mình nhanh chóng nhận biết được các ô chứa dữ liệu trùng, nhưng chưa xử lý được chúng.
Tiếp theo là cách Remove Duplicates (Xóa bỏ các bản sao).
- Chọn vùng dữ liệu.
- Vào tab Data -> Data Tools -> Remove Duplicates.
- Chọn các cột mà bạn muốn Excel kiểm tra để xác định trùng lặp.
- Nhấn OK. Excel sẽ xóa đi các hàng trùng lặp, chỉ giữ lại một bản duy nhất.
Cách này rất nhanh gọn nhưng cần cẩn thận vì nó sẽ xóa vĩnh viễn các bản sao.
Một cách khác mình hay dùng là sử dụng Advanced Filter để trích xuất dữ liệu duy nhất.
- Chuẩn bị một vùng trống để chứa kết quả.
- Chọn vùng dữ liệu gốc.
- Vào tab Data -> Sort & Filter -> Advanced.
- Chọn Copy to another location.
- Điền vùng dữ liệu gốc vào ô List range.
- Chọn ô đầu tiên của vùng trống đã chuẩn bị ở ô Copy to.
- Quan trọng: Tích vào ô Unique records only.
- Nhấn OK.
Cách này cho phép mình giữ lại cả dữ liệu gốc và lấy ra danh sách duy nhất ở một vùng khác, rất tiện lợi.
Cuối cùng, nếu các bạn cần một giải pháp linh hoạt hơn hoặc muốn tự động hóa, có thể kết hợp hàm IF với COUNTIF hoặc sử dụng Power Query. Tuy nhiên, những cách này hơi phức tạp hơn một chút.
Các bạn còn cách nào hiệu quả khác không? Cùng chia sẻ để mọi người cùng học hỏi nhé!