Chào các bác, dạo này em hay làm việc với các file excel mà dữ liệu nhập vào hay bị trùng lặp, mà số lượng dòng thì lại rất lớn, xóa tay thì mất thời gian quá. Em có tìm hiểu và áp dụng một vài cách để xử lý vấn đề này khá hiệu quả, chia sẻ lại cho anh em tham khảo, biết đâu lại giúp ích cho công việc của mọi người.
Cách 1: Dùng tính năng Remove Duplicates có sẵn trong Excel.
Đây là cách đơn giản và nhanh nhất. Các bước thực hiện như sau:
- Chọn vùng dữ liệu cần xử lý.
- Vào tab Data, chọn Remove Duplicates.
- Chọn các cột mà bạn muốn Excel kiểm tra trùng lặp.
- Nhấn OK.
Cách này rất hiệu quả khi bạn muốn xóa bỏ hoàn toàn các dòng bị trùng.
Cách 2: Dùng Conditional Formatting để tô màu các dòng trùng lặp.
Cách này không xóa dữ liệu mà chỉ giúp bạn nhận diện các dòng bị trùng một cách trực quan để có thể quyết định xử lý sau.
- Chọn vùng dữ liệu.
- Vào tab Home, chọn Conditional Formatting -> New Rule.
- Chọn Use a formula to determine which cells to format.
- Nhập công thức (giả sử bạn muốn kiểm tra trùng lặp ở cột A, bắt đầu từ dòng 2):
=COUNTIF($A$2:$A$1000,A2)>1(Điều chỉnh $A$1000 cho phù hợp với số dòng dữ liệu của bạn). - Chọn định dạng màu sắc bạn muốn.
- Nhấn OK.
Cách này hữu ích khi bạn cần xem xét lại và quyết định giữ lại bản ghi nào.
Ngoài ra, với những trường hợp phức tạp hơn, có thể kết hợp thêm các hàm như INDEX, MATCH, ROW để đánh số thứ tự duy nhất cho từng dòng hoặc lọc ra các bản ghi trùng lặp.
Hy vọng mẹo nhỏ này giúp ích được cho mọi người. Nếu ai có cách nào hay hơn hoặc gặp khó khăn trong quá trình áp dụng thì cứ chia sẻ bên dưới nhé, chúng ta cùng trao đổi.