Menu

App script quản lý rủi ro cho cá nhân & doanh nghiệp với báo cáo chuẩn định dạng biểu đồ

Tổng hợp các cách xử lý dữ liệu trùng lặp hiệu quả trong Excel

Thượng Triều Phúc 20/03/2026 13:05 213 lượt xem 2 trả lời

Dữ liệu trùng lặp là một vấn đề khá phổ biến khi làm việc với Excel, đặc biệt là khi tổng hợp dữ liệu từ nhiều nguồn khác nhau. Việc này không chỉ gây khó khăn trong việc phân tích mà còn có thể dẫn đến những sai sót không đáng có. Hôm nay, mình muốn chia sẻ một vài cách mà mình thường dùng để xử lý dữ liệu trùng lặp một cách nhanh chóng và hiệu quả.

Đầu tiên, cách đơn giản nhất là sử dụng tính năng Remove Duplicates có sẵn trong Excel. Bạn chỉ cần chọn vùng dữ liệu, vào tab Data, chọn Remove Duplicates và chọn các cột mà bạn muốn kiểm tra trùng lặp. Cách này rất nhanh nhưng sẽ xóa bỏ luôn các bản ghi trùng.

Nếu bạn muốn giữ lại tất cả các bản ghi nhưng chỉ đánh dấu hoặc lọc ra các bản ghi trùng, bạn có thể sử dụng Conditional Formatting. Chọn vùng dữ liệu, vào Home -> Conditional Formatting -> Highlight Cells Rules -> Duplicate Values. Bạn có thể chọn cách tô màu để dễ dàng nhận biết.

Một cách nâng cao hơn là dùng công thức kết hợp COUNTIF hoặc SUMPRODUCT. Ví dụ, để đánh dấu các dòng bị trùng dựa trên cột A, bạn có thể dùng công thức mảng trong Conditional Formatting:

=COUNTIF($A$1:A1, A1)>1

Hoặc nếu muốn đếm số lần xuất hiện của mỗi giá trị:

=COUNTIF(A:A, A1)

Ngoài ra, khi làm việc với các tập dữ liệu lớn, Power Query là một công cụ cực kỳ mạnh mẽ để loại bỏ hoặc nhóm các bản ghi trùng lặp một cách tự động và có thể lặp lại. Tuy hơi mất công tìm hiểu ban đầu nhưng về lâu dài sẽ tiết kiệm rất nhiều thời gian.

Mọi người thường dùng cách nào để xử lý dữ liệu trùng lặp? Có mẹo nào hay hơn không, chia sẻ cho mình với nhé!

5

Hay quá bạn ơi! Cảm ơn bạn đã chia sẻ thêm những cách xử lý dữ liệu trùng lặp rất hữu ích. Mình cũng thường dùng Conditional Formatting để làm nổi bật các dòng trùng lặp, nhìn rất trực quan.

Advanced Filter với "Unique records only" cũng là một lựa chọn tuyệt vời mà mình ít khi để ý tới. Liệu cách này có nhanh hơn Remove Duplicates khi xử lý file dung lượng lớn không nhỉ? Chia sẻ thêm kinh nghiệm của bạn nhé!

5

Cảm ơn bạn đã chia sẻ những cách rất hay để xử lý dữ liệu trùng lặp. Mình cũng hay dùng Remove Duplicates lắm, nó nhanh gọn thật. Ngoài ra, mình còn hay dùng kết hợp Conditional Formatting để tô màu các dòng trùng lặp, sau đó lọc ra để xem. Đôi khi còn dùng cả Advanced Filter với tùy chọn "Unique records only" nữa. Không biết bạn đã thử cách này chưa?

0

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký