Menu

Tổng hợp các cách xử lý dữ liệu trùng lặp hiệu quả trong Excel

Trình Bá Hậu 12/03/2026 18:14 190 lượt xem 2 trả lời

Chào các bạn, dạo gần đây mình thấy nhiều bạn gặp khó khăn trong việc xử lý dữ liệu bị trùng lặp trên Excel. Đúng là làm báo cáo hay phân tích dữ liệu mà có nhiều dòng trùng nhau thì vừa mất thời gian, vừa dễ sai sót. Mình đã tổng hợp lại một số cách hay ho để giải quyết vấn đề này, hy vọng sẽ giúp ích cho mọi người.

1. Sử dụng Remove Duplicates:

Đây là tính năng có sẵn trong Excel, cực kỳ nhanh chóng và đơn giản.

  • Chọn vùng dữ liệu cần xử lý.
  • Vào tab Data -> Remove Duplicates.
  • Chọn các cột mà bạn muốn Excel kiểm tra sự trùng lặp.
  • Nhấn OK.

Ưu điểm: Nhanh, dễ dùng. Nhược điểm: Xóa luôn dữ liệu gốc, không giữ lại.

2. Sử dụng Conditional Formatting để tô màu:

Nếu bạn muốn nhận biết các dòng trùng lặp mà không xóa ngay, cách này rất hữu ích.

  • Chọn vùng dữ liệu.
  • Vào tab Home -> Conditional Formatting -> New Rule...
  • Chọn Use a formula to determine which cells to format.
  • Nhập công thức (giả sử dữ liệu bắt đầu từ A2): =COUNTIF($A$2:$A$100, A2)>1 (kiểm tra cột A). Bạn có thể điều chỉnh phạm vi và cột cho phù hợp.
  • Chọn định dạng màu sắc bạn muốn.
  • Nhấn OK.

Ưu điểm: Không xóa dữ liệu, dễ dàng nhận biết. Nhược điểm: Chỉ là đánh dấu, chưa xử lý triệt để.

3. Kết hợp Advanced Filter:

Cách này cho phép bạn lọc ra các bản ghi duy nhất và copy sang một vị trí khác, giữ lại file gốc.

  • Chọn vùng dữ liệu.
  • Vào tab Data -> Advanced.
  • Chọn Copy to another location.
  • Nhập vùng dữ liệu vào List range.
  • Chọn ô bắt đầu cho dữ liệu lọc ở Copy to.
  • Tick vào ô Unique records only.
  • Nhấn OK.

Ưu điểm: Giữ lại file gốc, có thể lọc theo điều kiện. Nhược điểm: Hơi phức tạp hơn Remove Duplicates.

Mọi người có cách nào hay hơn hoặc gặp trường hợp đặc biệt thì chia sẻ thêm nhé!

2

Cảm ơn bạn đã chia sẻ bài viết rất hữu ích về xử lý dữ liệu trùng lặp!
Mình thấy Remove Duplicates là cách nhanh nhất cho những trường hợp đơn giản. Tuy nhiên, với những file lớn hoặc cần xử lý phức tạp hơn, mình thường kết hợp thêm Advanced Filter để lọc ra các bản ghi duy nhất theo điều kiện riêng.
Bạn có hay dùng cách nào khác cho các tình huống đặc biệt không?

1

Đúng là bài viết rất thiết thực! Với kinh nghiệm của mình, ngoài Remove DuplicatesAdvanced Filter, mình còn hay dùng Power Query để xử lý dữ liệu trùng lặp, nhất là với các file có cấu trúc phức tạp hoặc cần làm sạch định kỳ. Power Query cho phép mình định nghĩa các bước xử lý rõ ràng, dễ dàng tái sử dụng và cập nhật khi có dữ liệu mới.

Bạn có đề cập đến việc dùng Conditional Formatting để tô màu các dòng trùng lặp trước khi xóa không? Đó cũng là một cách hay để "nhìn" thấy rõ vấn đề trước khi xử lý.

5

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký