Chào các bác, hôm nay em muốn chia sẻ một cách khá hay để xử lý dữ liệu trùng lặp trong Excel mà không cần dùng đến hàm hay VBA phức tạp. Em thường xuyên phải làm việc với các file excel có dữ liệu lớn và đôi khi gặp phải tình trạng trùng lặp thông tin. Trước đây, em toàn dùng Remove Duplicates hoặc các hàm như COUNTIF để lọc, nhưng với lượng dữ liệu khổng lồ thì khá chậm và tốn công.
Gần đây, em tìm hiểu về Power Query và thấy nó giải quyết vấn đề này một cách cực kỳ hiệu quả. Các bước thực hiện khá đơn giản:
- Đầu tiên, các bác nạp dữ liệu vào Power Query Editor.
- Chọn cột hoặc các cột chứa thông tin các bác muốn kiểm tra trùng lặp.
- Chuột phải vào tiêu đề cột đó, chọn Remove Duplicates.
Thao tác này sẽ tự động loại bỏ các hàng trùng lặp dựa trên cột các bác đã chọn. Cái hay là Power Query xử lý rất nhanh, kể cả với hàng trăm nghìn dòng. Sau khi xử lý xong, các bác chỉ cần Close & Load để đưa dữ liệu đã lọc về lại bảng tính Excel.
Cách này rất hữu ích cho các bác nào thường xuyên phải tổng hợp báo cáo, nhập liệu từ nhiều nguồn hoặc làm sạch dữ liệu trước khi phân tích. Nó giúp tiết kiệm kha khá thời gian và công sức. Các bác thử xem sao nhé!