Chào mọi người,
Hôm nay mình muốn chia sẻ một mẹo nhỏ mà mình hay dùng để xử lý dữ liệu trùng lặp trong Excel, giúp tiết kiệm kha khá thời gian so với việc lọc tay. Tình huống là mình có một danh sách dài, cần loại bỏ các dòng bị trùng lặp dựa trên một hoặc nhiều cột.
Cách mình hay làm là dùng kết hợp tính năng Remove Duplicates với một chút thủ thuật.
Các bước thực hiện:
- Đầu tiên, chọn toàn bộ vùng dữ liệu bạn muốn xử lý.
- Vào tab Data, chọn Remove Duplicates.
- Trong hộp thoại hiện ra, bạn tích chọn các cột mà bạn muốn Excel dựa vào đó để xác định dữ liệu trùng lặp. Ví dụ, nếu bạn muốn loại bỏ các dòng trùng lặp dựa trên cả cột 'Email' và 'Tên', hãy tích chọn cả hai cột này.
- Nhấn OK.
Excel sẽ tự động xóa các dòng trùng lặp và thông báo cho bạn biết đã xóa bao nhiêu dòng, còn lại bao nhiêu dòng.
Lưu ý nhỏ:
- Cách này sẽ xóa vĩnh viễn các dòng trùng lặp, nên hãy sao lưu dữ liệu gốc trước khi thực hiện nếu bạn không chắc chắn.
- Nếu bạn muốn giữ lại một bản sao của dữ liệu gốc hoặc muốn kiểm soát việc xóa dễ dàng hơn, bạn có thể tạo một cột phụ và dùng hàm
COUNTIFđể đánh dấu các dòng trùng lặp, sau đó lọc theo cột đó.
Hy vọng mẹo nhỏ này hữu ích cho mọi người!