Chào các bạn, dạo gần đây mình thấy nhiều bạn gặp khó khăn trong việc xử lý dữ liệu bị trùng lặp trên Excel. Đúng là làm báo cáo hay phân tích dữ liệu mà có nhiều dòng trùng nhau thì vừa mất thời gian, vừa dễ sai sót. Mình đã tổng hợp lại một số cách hay ho để giải quyết vấn đề này, hy vọng sẽ giúp ích cho mọi người.
1. Sử dụng Remove Duplicates:
Đây là tính năng có sẵn trong Excel, cực kỳ nhanh chóng và đơn giản.
- Chọn vùng dữ liệu cần xử lý.
- Vào tab Data -> Remove Duplicates.
- Chọn các cột mà bạn muốn Excel kiểm tra sự trùng lặp.
- Nhấn OK.
Ưu điểm: Nhanh, dễ dùng. Nhược điểm: Xóa luôn dữ liệu gốc, không giữ lại.
2. Sử dụng Conditional Formatting để tô màu:
Nếu bạn muốn nhận biết các dòng trùng lặp mà không xóa ngay, cách này rất hữu ích.
- Chọn vùng dữ liệu.
- Vào tab Home -> Conditional Formatting -> New Rule...
- Chọn Use a formula to determine which cells to format.
- Nhập công thức (giả sử dữ liệu bắt đầu từ A2):
=COUNTIF($A$2:$A$100, A2)>1(kiểm tra cột A). Bạn có thể điều chỉnh phạm vi và cột cho phù hợp. - Chọn định dạng màu sắc bạn muốn.
- Nhấn OK.
Ưu điểm: Không xóa dữ liệu, dễ dàng nhận biết. Nhược điểm: Chỉ là đánh dấu, chưa xử lý triệt để.
3. Kết hợp Advanced Filter:
Cách này cho phép bạn lọc ra các bản ghi duy nhất và copy sang một vị trí khác, giữ lại file gốc.
- Chọn vùng dữ liệu.
- Vào tab Data -> Advanced.
- Chọn Copy to another location.
- Nhập vùng dữ liệu vào List range.
- Chọn ô bắt đầu cho dữ liệu lọc ở Copy to.
- Tick vào ô Unique records only.
- Nhấn OK.
Ưu điểm: Giữ lại file gốc, có thể lọc theo điều kiện. Nhược điểm: Hơi phức tạp hơn Remove Duplicates.
Mọi người có cách nào hay hơn hoặc gặp trường hợp đặc biệt thì chia sẻ thêm nhé!