Chào các bạn, mình là một thành viên mới của diễn đàn. Hôm nay mình muốn chia sẻ một tiện ích nhỏ mà mình thường dùng để xử lý dữ liệu trong Excel, hy vọng sẽ giúp ích cho các bạn nào đang làm việc với các bảng dữ liệu lớn.
Trong quá trình làm việc, không ít lần chúng ta phải xử lý các bảng dữ liệu mà ở đó có các dòng thông tin bị trùng lặp. Việc kiểm tra và loại bỏ chúng thủ công rất tốn thời gian và dễ sai sót. Mình đã tìm hiểu và áp dụng một cách khá hiệu quả để tự động hóa việc này.
Cách mình hay làm là sử dụng Conditional Formatting kết hợp với một chút thủ thuật. Thay vì chỉ tô màu các ô trùng lặp, mình muốn tô màu cả dòng để dễ dàng nhận diện và xử lý.
Các bước thực hiện như sau:
- Chọn toàn bộ vùng dữ liệu bạn muốn kiểm tra.
- Vào tab Home, chọn Conditional Formatting -> New Rule.
- Chọn loại quy tắc là Use a formula to determine which cells to format.
- Trong ô công thức, bạn nhập công thức sau (giả sử dữ liệu của bạn bắt đầu từ A2, và bạn muốn kiểm tra sự trùng lặp dựa trên cột A):
Lưu ý: Bạn cần thay đổi phạm vi=COUNTIF($A$2:$A$1000,A2)>1$A$2:$A$1000cho phù hợp với dữ liệu thực tế của mình. Nếu muốn kiểm tra trùng lặp dựa trên nhiều cột, bạn có thể kết hợp hàmANDvàCOUNTIFS. - Nhấn nút Format, chọn tab Fill và chọn màu bạn muốn tô cho các dòng trùng lặp.
- Nhấn OK để áp dụng.
Với cách này, tất cả các dòng có dữ liệu trùng lặp (dựa trên cột bạn chọn) sẽ được tô màu. Bạn có thể dễ dàng xem xét và quyết định giữ lại hay xóa bỏ các dòng đó.
Ngoài ra, bạn có thể sử dụng các tiện ích VBA hoặc các add-in khác để xử lý nhanh hơn nữa, nhưng với cách này thì không cần cài đặt gì thêm mà vẫn rất hiệu quả. Nếu có bạn nào có cách nào hay hơn hoặc gặp khó khăn khi áp dụng, hãy cùng thảo luận nhé!