Menu

App script quản lý rủi ro cho cá nhân & doanh nghiệp với báo cáo chuẩn định dạng biểu đồ

Tổng hợp các cách xử lý dữ liệu trùng lặp trong Excel

Đào Trang Nhân 10/04/2026 03:01 550 lượt xem 3 trả lời

Dạo gần đây mình thấy nhiều anh em hỏi về cách xử lý dữ liệu bị trùng. Đúng là trong quá trình làm việc với Excel, việc gặp phải dữ liệu trùng lặp là không thể tránh khỏi, gây ra nhiều phiền toái và sai sót trong phân tích. Vì vậy, hôm nay mình xin tổng hợp lại một số cách hiệu quả để nhận diện và loại bỏ dữ liệu trùng, hy vọng sẽ giúp ích cho mọi người.

1. Sử dụng Conditional Formatting để tô màu

  • Chọn vùng dữ liệu cần kiểm tra.
  • Vào tab Home -> Conditional Formatting -> Highlight Cells Rules -> Duplicate Values.
  • Chọn kiểu định dạng và nhấn OK. Cách này giúp bạn dễ dàng nhìn thấy các ô chứa dữ liệu trùng.

2. Sử dụng Remove Duplicates

  • Chọn vùng dữ liệu.
  • Vào tab Data -> Remove Duplicates.
  • Chọn các cột mà bạn muốn kiểm tra trùng lặp và nhấn OK. Excel sẽ tự động xóa các hàng bị trùng dựa trên lựa chọn của bạn. Lưu ý, cách này sẽ xóa vĩnh viễn dữ liệu trùng, nên hãy sao lưu trước khi thực hiện.

3. Sử dụng Advanced Filter

  • Chọn vùng dữ liệu.
  • Vào tab Data -> Advanced.
  • Trong hộp thoại Advanced Filter, chọn Copy to another location.
  • Tại mục List range, chọn vùng dữ liệu của bạn.
  • Tại mục Criteria range, bạn có thể để trống nếu chỉ muốn lọc duy nhất.
  • Tại mục Copy to, chọn một ô trống để đặt kết quả.
  • Quan trọng: Tick vào ô Unique records only.
  • Nhấn OK. Kết quả sẽ là một danh sách duy nhất, không trùng lặp.

Ngoài ra, các bạn có thể kết hợp với các hàm như COUNTIF để đếm số lần xuất hiện của một giá trị, từ đó xác định dữ liệu trùng. Mong rằng những tổng hợp này sẽ giúp các bạn xử lý dữ liệu hiệu quả hơn.

5

Tuyệt vời, cảm ơn bạn đã chia sẻ một bài viết rất hữu ích! Mình cũng thấy Conditional Formatting là một cách trực quan để nhận diện dữ liệu trùng.

Thêm vào đó, mình cũng hay dùng kết hợp COUNTIF với Conditional Formatting. Ví dụ, mình sẽ tạo một cột phụ với công thức =COUNTIF(A:A, A1) (với A:A là cột chứa dữ liệu cần kiểm tra) để đếm số lần xuất hiện của mỗi mục. Sau đó, mình chỉ cần tô màu những ô có giá trị lớn hơn 1 là ra ngay dữ liệu trùng. Cách này cũng khá hiệu quả và dễ áp dụng.

0
Tuyệt vời! Cảm ơn bạn đã tổng hợp các cách xử lý dữ liệu trùng lặp trong Excel. Mình cũng hay gặp tình huống này và thường dùng Conditional Formatting để đánh dấu, sau đó mới lọc và xóa. Ngoài ra, mình còn hay dùng chức năng "Remove Duplicates" trong tab Data nữa, rất nhanh gọn và hiệu quả cho những trường hợp đơn giản.

Không biết bạn có kinh nghiệm nào với các tập dữ liệu lớn không? Đôi khi với file vài chục nghìn dòng, mình thấy xử lý hơi chậm.

2

Mình thấy cách dùng COUNTIF kết hợp với Conditional Formatting của bạn cũng rất hay đó! Rất trực quan để xác định xem một mục nào đó có bị lặp lại hay không.

Với dữ liệu lớn, mình cũng hay gặp vấn đề hiệu suất. Ngoài "Remove Duplicates", mình có thử dùng Power Query để xử lý dữ liệu trùng và cảm thấy khá ổn định, đặc biệt là khi cần lặp lại quy trình này nhiều lần. Bạn đã thử dùng Power Query cho các tập dữ liệu lớn chưa?

0

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký