Chào các bạn, mình là thành viên mới của diễn đàn. Hôm nay mình muốn chia sẻ một mẹo nhỏ mà mình thường dùng để xử lý dữ liệu bị trùng lặp trong Excel, hy vọng sẽ giúp ích được cho mọi người.
Trong quá trình làm việc, đôi khi chúng ta gặp phải những bảng dữ liệu có nhiều dòng bị trùng thông tin. Việc này không chỉ làm báo cáo nhìn thiếu chuyên nghiệp mà còn có thể gây sai sót khi phân tích. Xóa thủ công thì rất tốn thời gian, đặc biệt với file có hàng nghìn dòng.
Cách mình hay làm là sử dụng chức năng Remove Duplicates (Xóa trùng lặp) có sẵn trong Excel. Nó rất đơn giản và hiệu quả:
- Bước 1: Chọn toàn bộ vùng dữ liệu bạn muốn xử lý.
- Bước 2: Vào tab Data (Dữ liệu) trên thanh công cụ.
- Bước 3: Tìm và nhấn vào nút Remove Duplicates (Xóa trùng lặp).
- Bước 4: Một hộp thoại sẽ hiện ra. Bạn cần chọn các cột mà bạn muốn Excel kiểm tra để xác định dữ liệu trùng lặp. Ví dụ, nếu bạn muốn xóa các dòng trùng lặp dựa trên cả Mã nhân viên và Tên nhân viên, hãy tick chọn cả hai cột đó. Nếu chỉ cần trùng lặp dựa trên Mã nhân viên thì chỉ tick cột đó thôi.
- Bước 5: Nhấn OK. Excel sẽ báo cho bạn biết đã xóa bao nhiêu dòng trùng và còn lại bao nhiêu dòng duy nhất.
Lưu ý nhỏ là chức năng này sẽ xóa vĩnh viễn các dòng trùng lặp, nên tốt nhất bạn nên sao lưu file hoặc tạo một bản sao trước khi thực hiện nhé.
Hy vọng mẹo nhỏ này hữu ích cho các bạn. Nếu ai có cách nào hay hơn hoặc gặp khó khăn gì, đừng ngần ngại chia sẻ hoặc hỏi nhé!