Menu

Anh em chia sẻ cách xử lý dữ liệu trùng lặp hiệu quả?

Quyền Liêm Hạnh 07/06/2026 16:13 87 lượt xem 2 trả lời

Dạo này làm báo cáo nhiều, gặp mãi cái vụ dữ liệu nó cứ bị trùng lặp, nhìn ngứa mắt mà số liệu cũng sai. Mình đã thử dùng tính năng Remove Duplicates của Excel nhưng đôi khi nó lại xóa nhầm hoặc không xử lý hết các trường hợp đặc biệt.

Có anh em nào có 'chiêu' gì cao siêu hơn không? Ví dụ như dùng công thức hay Power Query chẳng hạn, để xử lý dữ liệu trùng lặp một cách triệt để và hiệu quả hơn?

Mình đang quan tâm mấy trường hợp sau:

  • Xử lý trùng lặp dựa trên nhiều cột.
  • Xóa bỏ các bản ghi trùng lặp nhưng giữ lại bản ghi đầu tiên (hoặc cuối cùng).
  • Phát hiện và đánh dấu các bản ghi trùng lặp mà không xóa đi.

Anh em nào có kinh nghiệm vụ này thì chỉ giáo cho mình với ạ. Cảm ơn mọi người nhiều!

1

Chào bạn, vụ dữ liệu trùng lặp này đúng là nhức đầu thật! Mình cũng từng bị nhiều lần rồi.

Ngoài Remove Duplicates, mình thấy Power Query xử lý vụ này khá ngon lành, đặc biệt là khi bạn cần xử lý dựa trên nhiều cột. Chỉ cần vào tab Data > Get Data > From Table/Range, rồi trong Power Query Editor, chọn các cột cần so sánh, chuột phải chọn "Remove Duplicates". Nó cho phép mình kiểm soát tốt hơn nhiều.

Bạn đã thử dùng Power Query chưa? Có gặp khó khăn gì không, mình có thể chia sẻ chi tiết hơn.

2

Công nhận vụ dữ liệu trùng lặp này làm đau đầu thật sự! Remove Duplicates đôi khi không "thông minh" như mình mong muốn.

Mình cũng hay dùng Power Query để xử lý, nó mạnh mẽ hơn hẳn. Với trường hợp trùng lặp dựa trên nhiều cột, bạn có thể group by các cột đó rồi chọn một cột bất kỳ để giữ lại (ví dụ: First Row). Như vậy sẽ giữ lại được một bản ghi duy nhất cho mỗi tổ hợp giá trị ở các cột bạn chọn.

Ngoài ra, nếu bạn muốn làm bằng công thức, có thể thử kết hợp INDEX, MATCHCOUNTIF/COUNTIFS để xác định các dòng trùng lặp, sau đó dùng Conditional Formatting để tô màu hoặc Filter ra. Tuy nhiên, cách này sẽ hơi "phức tạp" hơn Power Query một chút.

Bạn có hay làm việc với Power Query không? Nếu cần chi tiết về cách group by để loại bỏ trùng lặp, cứ nói nhé!

3

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký