Chào mọi người,
Dạo này mình hay làm việc với các file dữ liệu lớn, và việc xóa các dòng trùng lặp luôn là một công đoạn tốn khá nhiều thời gian. Hôm nay, mình muốn chia sẻ một mẹo nhỏ mà mình mới khám phá ra, giúp xử lý vấn đề này cực kỳ hiệu quả bằng Power Query.
Cách này nhanh hơn rất nhiều so với việc dùng chức năng Remove Duplicates thông thường, đặc biệt khi bạn cần xử lý nhiều bảng hoặc muốn tự động hóa quy trình.
Các bước thực hiện:
- Đầu tiên, bạn cần đưa dữ liệu vào Power Query. Vào tab Data -> From Table/Range.
- Trong cửa sổ Power Query Editor, chọn cột hoặc các cột bạn muốn xác định dữ liệu trùng.
- Chuột phải vào tiêu đề cột đó, chọn Remove Duplicates.
- Nếu bạn muốn xóa trùng dựa trên nhiều cột, hãy giữ phím Ctrl và chọn nhiều cột trước khi chuột phải.
- Sau khi xóa trùng, vào tab Home -> Close & Load để đưa kết quả về lại Excel.
Ưu điểm của cách này là nó tạo ra một quy trình tự động. Mỗi lần dữ liệu nguồn thay đổi, bạn chỉ cần vào Data -> Refresh All là bảng kết quả sẽ tự cập nhật mà không cần thao tác lại.
Rất mong mẹo nhỏ này hữu ích cho các bạn!