Chào mọi người,
Mình làm kế toán và thường xuyên phải làm việc với các file Excel chứa rất nhiều dữ liệu, đặc biệt là các danh sách như hóa đơn, phiếu thu chi, danh mục khách hàng/nhà cung cấp. Đôi khi, do nhập liệu hoặc quá trình tổng hợp, chúng ta có thể gặp phải tình trạng dữ liệu bị trùng lặp.
Việc này gây ra nhiều phiền toái, làm sai lệch số liệu báo cáo và tốn thời gian để rà soát thủ công. Hôm nay, mình muốn chia sẻ một vài cách hiệu quả để xử lý dữ liệu trùng lặp trong Excel mà mình hay áp dụng, hy vọng sẽ giúp ích cho các bạn đồng nghiệp.
1. Sử dụng tính năng Remove Duplicates:
Đây là cách đơn giản và nhanh nhất cho các trường hợp thông thường. Các bước thực hiện:
- Chọn vùng dữ liệu bạn muốn kiểm tra.
- Vào tab Data, chọn Remove Duplicates.
- Chọn các cột mà bạn muốn Excel kiểm tra sự trùng lặp. Nếu bạn muốn xác định một dòng hoàn toàn trùng lặp thì chọn tất cả các cột. Nếu chỉ muốn loại bỏ các dòng trùng lặp dựa trên một hoặc hai cột cụ thể (ví dụ: trùng số hóa đơn), thì chỉ chọn các cột đó.
- Nhấn OK.
2. Sử dụng Conditional Formatting để tô màu dữ liệu trùng lặp:
Cách này giúp bạn nhìn thấy các dòng trùng lặp mà không xóa chúng đi ngay lập tức, rất hữu ích khi cần xem xét kỹ hơn.
- Chọn vùng dữ liệu.
- Vào tab Home, chọn Conditional Formatting -> Highlight Cells Rules -> Duplicate Values.
- Chọn kiểu định dạng và nhấn OK.
3. Sử dụng công thức mảng (Array Formula) hoặc hàm COUNTIFS:
Đối với các trường hợp phức tạp hơn hoặc khi bạn muốn đánh dấu (flag) các dòng trùng lặp để xử lý sau, bạn có thể dùng công thức.
Ví dụ, để đánh dấu các dòng trùng lặp dựa trên cột A và cột B, bạn có thể dùng công thức sau trong một cột mới (giả sử bạn đặt công thức ở ô C2 và kéo xuống):
=IF(COUNTIFS($A$2:$A$100,$A2,$B$2:$B$100,$B2)>1,"Trung lap","OK")Các bạn thấy cách nào hiệu quả nhất? Có ai có kinh nghiệm hay mẹo nào khác để xử lý vấn đề này không, chia sẻ thêm cho mọi người cùng học hỏi nhé!