Menu

App script quản lý rủi ro cho cá nhân & doanh nghiệp với báo cáo chuẩn định dạng biểu đồ

Tự động hóa việc kiểm tra và định dạng dữ liệu trùng lặp trong Excel

Vương Hoàng My 02/04/2026 22:12 138 lượt xem 3 trả lời

Chào các bạn, mình là một thành viên mới của diễn đàn. Hôm nay mình muốn chia sẻ một tiện ích nhỏ mà mình thường dùng để xử lý dữ liệu trong Excel, hy vọng sẽ giúp ích cho các bạn nào đang làm việc với các bảng dữ liệu lớn.

Trong quá trình làm việc, không ít lần chúng ta phải xử lý các bảng dữ liệu mà ở đó có các dòng thông tin bị trùng lặp. Việc kiểm tra và loại bỏ chúng thủ công rất tốn thời gian và dễ sai sót. Mình đã tìm hiểu và áp dụng một cách khá hiệu quả để tự động hóa việc này.

Cách mình hay làm là sử dụng Conditional Formatting kết hợp với một chút thủ thuật. Thay vì chỉ tô màu các ô trùng lặp, mình muốn tô màu cả dòng để dễ dàng nhận diện và xử lý.

Các bước thực hiện như sau:

  • Chọn toàn bộ vùng dữ liệu bạn muốn kiểm tra.
  • Vào tab Home, chọn Conditional Formatting -> New Rule.
  • Chọn loại quy tắc là Use a formula to determine which cells to format.
  • Trong ô công thức, bạn nhập công thức sau (giả sử dữ liệu của bạn bắt đầu từ A2, và bạn muốn kiểm tra sự trùng lặp dựa trên cột A):
    =COUNTIF($A$2:$A$1000,A2)>1
    Lưu ý: Bạn cần thay đổi phạm vi $A$2:$A$1000 cho phù hợp với dữ liệu thực tế của mình. Nếu muốn kiểm tra trùng lặp dựa trên nhiều cột, bạn có thể kết hợp hàm ANDCOUNTIFS.
  • Nhấn nút Format, chọn tab Fill và chọn màu bạn muốn tô cho các dòng trùng lặp.
  • Nhấn OK để áp dụng.

Với cách này, tất cả các dòng có dữ liệu trùng lặp (dựa trên cột bạn chọn) sẽ được tô màu. Bạn có thể dễ dàng xem xét và quyết định giữ lại hay xóa bỏ các dòng đó.

Ngoài ra, bạn có thể sử dụng các tiện ích VBA hoặc các add-in khác để xử lý nhanh hơn nữa, nhưng với cách này thì không cần cài đặt gì thêm mà vẫn rất hiệu quả. Nếu có bạn nào có cách nào hay hơn hoặc gặp khó khăn khi áp dụng, hãy cùng thảo luận nhé!

5

Chào bạn, rất vui được thấy bạn chia sẻ kinh nghiệm trên diễn đàn!

Việc tự động hóa kiểm tra dữ liệu trùng lặp thực sự là một cứu cánh khi làm việc với bảng dữ liệu lớn. Mình cũng hay dùng Conditional Formatting để tô màu các ô trùng lặp, sau đó dùng chức năng Remove Duplicates. Cách này khá nhanh và trực quan.

Không biết bạn có thể chia sẻ cụ thể hơn về "cách mà bạn" đã áp dụng không? Mình tò mò muốn học hỏi thêm đó!

5

Mình cũng từng rất đau đầu với mớ dữ liệu trùng lặp, nhất là khi file lên đến hàng chục nghìn dòng. Ngoài cách Conditional Formatting với Remove Duplicates mà bạn kia chia sẻ, mình còn thấy có một cách khác dùng Power Query cũng rất hay. Nó cho phép mình xử lý và loại bỏ trùng lặp một cách tự động, chỉ cần thiết lập một lần là chạy được.

Bạn có thể chia sẻ chi tiết hơn về "cách mà bạn" đã áp dụng không? Có thể dùng VBA hay hàm gì đặc biệt không? Mình rất muốn học thêm những thủ thuật mới để làm việc hiệu quả hơn.

4

Hay quá, cảm ơn bạn đã chia sẻ mẹo này!

Mình cũng thường xuyên gặp vấn đề dữ liệu trùng lặp, nhất là khi tổng hợp báo cáo từ nhiều nguồn khác nhau. Cách bạn dùng Conditional Formatting kết hợp Remove Duplicates khá trực quan và dễ áp dụng.

Không biết bạn có kinh nghiệm nào khác để xử lý trường hợp dữ liệu trùng lặp nhưng có một vài ký tự khác biệt (ví dụ: "Nguyễn Văn A" và "Nguyễn Văn A ") không? Mình hay phải dò từng cái rất mất thời gian.

2

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký