Menu

Tổng hợp các cách xử lý dữ liệu trùng lặp trong Excel

Đậu Hoài Đức 06/06/2026 05:22 187 lượt xem 1 trả lời

Chào mọi người, dạo này mình thấy nhiều bạn gặp khó khăn trong việc xử lý dữ liệu trùng lặp trong Excel, đặc biệt là khi làm việc với các file lớn. Vì vậy, mình tổng hợp lại một vài cách phổ biến và hiệu quả để mọi người tham khảo, hy vọng sẽ giúp ích cho công việc của các bạn.

1. Sử dụng Remove Duplicates:

  • Đây là cách nhanh nhất để loại bỏ các dòng trùng lặp hoàn toàn.
  • Chọn vùng dữ liệu cần xử lý, vào tab Data -> Remove Duplicates.
  • Chọn các cột mà bạn muốn Excel kiểm tra sự trùng lặp.

2. Sử dụng Conditional Formatting để đánh dấu:

  • Nếu bạn muốn giữ lại dữ liệu gốc và chỉ đánh dấu các dòng trùng lặp để xem xét.
  • Chọn vùng dữ liệu, vào tab Home -> Conditional Formatting -> New Rule.
  • Chọn Use a formula to determine which cells to format và nhập công thức: =COUNTIF(A:A,A1)>1 (với cột A là cột bạn muốn kiểm tra).
  • Chọn định dạng màu sắc mong muốn.

3. Sử dụng Advanced Filter để lọc và sao chép:

  • Cách này cho phép bạn lọc ra các bản ghi duy nhất và sao chép chúng sang một vị trí khác.
  • Vào tab Data -> Advanced.
  • Chọn Copy to another location, nhập vùng dữ liệu, chọn vị trí đích và tick vào ô Unique records only.

Ngoài ra, với các trường hợp phức tạp hơn, bạn có thể kết hợp các hàm như COUNTIF, SUMPRODUCT hoặc sử dụng Power Query để xử lý hiệu quả hơn.

Mọi người có phương pháp nào hay hơn không, chia sẻ thêm để chúng ta cùng học hỏi nhé!

4

Topic này hay quá, cảm ơn bạn đã tổng hợp!

Riêng về phần Remove Duplicates, mình thấy nó rất tiện cho trường hợp muốn xóa hẳn các dòng trùng. Tuy nhiên, đôi khi mình chỉ muốn đánh dấu các dòng trùng thôi, ví dụ để kiểm tra lại hoặc xử lý theo một logic khác. Với trường hợp này, mình thường dùng Conditional Formatting kết hợp với hàm COUNTIF.

Ví dụ, nếu muốn đánh dấu các dòng bị trùng ở cột A, mình sẽ chọn toàn bộ cột A, vào Conditional Formatting -> New Rule -> Use a formula to determine which cells to format. Công thức sẽ là: =COUNTIF($A$1:$A$1000,A1)>1 (điều chỉnh phạm vi $A$1:$A$1000 cho phù hợp).

Cách này tuy không xóa dữ liệu nhưng giúp mình nhìn rõ được đâu là "kẻ hai mặt" trong bảng tính. Không biết mọi người có cách nào khác để xử lý dữ liệu trùng lặp mà vẫn giữ lại được bản gốc không?

2

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký