Menu

Mẹo nhỏ giúp xử lý dữ liệu trùng lặp hiệu quả mà không cần xóa tay

Dai Huân Nắng 14/03/2026 20:11 547 lượt xem 2 trả lời

Chào các bác, dạo này em hay làm việc với các file excel mà dữ liệu nhập vào hay bị trùng lặp, mà số lượng dòng thì lại rất lớn, xóa tay thì mất thời gian quá. Em có tìm hiểu và áp dụng một vài cách để xử lý vấn đề này khá hiệu quả, chia sẻ lại cho anh em tham khảo, biết đâu lại giúp ích cho công việc của mọi người.

Cách 1: Dùng tính năng Remove Duplicates có sẵn trong Excel.

Đây là cách đơn giản và nhanh nhất. Các bước thực hiện như sau:

  • Chọn vùng dữ liệu cần xử lý.
  • Vào tab Data, chọn Remove Duplicates.
  • Chọn các cột mà bạn muốn Excel kiểm tra trùng lặp.
  • Nhấn OK.

Cách này rất hiệu quả khi bạn muốn xóa bỏ hoàn toàn các dòng bị trùng.

Cách 2: Dùng Conditional Formatting để tô màu các dòng trùng lặp.

Cách này không xóa dữ liệu mà chỉ giúp bạn nhận diện các dòng bị trùng một cách trực quan để có thể quyết định xử lý sau.

  • Chọn vùng dữ liệu.
  • Vào tab Home, chọn Conditional Formatting -> New Rule.
  • Chọn Use a formula to determine which cells to format.
  • Nhập công thức (giả sử bạn muốn kiểm tra trùng lặp ở cột A, bắt đầu từ dòng 2): =COUNTIF($A$2:$A$1000,A2)>1 (Điều chỉnh $A$1000 cho phù hợp với số dòng dữ liệu của bạn).
  • Chọn định dạng màu sắc bạn muốn.
  • Nhấn OK.

Cách này hữu ích khi bạn cần xem xét lại và quyết định giữ lại bản ghi nào.

Ngoài ra, với những trường hợp phức tạp hơn, có thể kết hợp thêm các hàm như INDEX, MATCH, ROW để đánh số thứ tự duy nhất cho từng dòng hoặc lọc ra các bản ghi trùng lặp.

Hy vọng mẹo nhỏ này giúp ích được cho mọi người. Nếu ai có cách nào hay hơn hoặc gặp khó khăn trong quá trình áp dụng thì cứ chia sẻ bên dưới nhé, chúng ta cùng trao đổi.

5

Cái vụ dữ liệu trùng lặp đúng là đau đầu thật bác ạ! Em cũng hay gặp tình huống tương tự.

Ngoài Remove Duplicates mà bác chia sẻ, em hay dùng thêm một cách nữa là kết hợp Power Query. Tuy hơi mất công cài đặt ban đầu một chút nhưng một khi đã quen thì xử lý dữ liệu lớn, có cấu trúc phức tạp hay cần làm sạch thường xuyên thì nó cực kỳ hiệu quả luôn. Power Query có thể tự động loại bỏ trùng lặp, chuẩn hóa dữ liệu và thực hiện nhiều thao tác khác nữa mà không làm ảnh hưởng đến file gốc.

Bác nào thử cách này chưa, chia sẻ kinh nghiệm với em với!

5

Cảm ơn bạn đã chia sẻ mẹo rất hay! Tính năng Remove Duplicates đúng là cứu cánh cho những ai làm việc với dữ liệu lớn. Mình cũng hay dùng cách này, nó nhanh và hiệu quả thật.

Ngoài ra, bạn có thể thử kết hợp với cách dùng Advanced Filter để lọc ra các dòng duy nhất. Cách này linh hoạt hơn một chút khi bạn muốn lọc dữ liệu sang một vùng khác thay vì xóa trực tiếp.

Không biết bạn đã thử cách này bao giờ chưa?

3

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký