Chào mọi người,
Mình có một tình huống thế này, thường xuyên phải tổng hợp dữ liệu từ nhiều file Excel khác nhau, và đôi khi trong cùng một file, mình cần trích xuất một danh sách duy nhất (unique list) từ nhiều cột khác nhau mà không bị trùng lặp.
Trước đây, mình hay làm thủ công bằng cách copy tất cả dữ liệu ra một cột, rồi dùng chức năng Remove Duplicates. Tuy nhiên, cách này khá mất thời gian và dễ sai sót, đặc biệt với lượng dữ liệu lớn.
Gần đây, mình có tìm hiểu và áp dụng Power Query để giải quyết vấn đề này một cách tự động và hiệu quả. Cách này giúp mình tiết kiệm rất nhiều thời gian và đảm bảo tính chính xác.
Các bước cơ bản mình thường làm như sau:
- Bước 1: Load dữ liệu từ các cột cần lấy danh sách duy nhất vào Power Query.
- Bước 2: Sử dụng chức năng 'Unpivot Columns' để gom tất cả các giá trị về một cột duy nhất.
- Bước 3: Dùng chức năng 'Remove Duplicates' ngay trên Power Query để loại bỏ các giá trị trùng lặp.
- Bước 4: Load kết quả ra Excel dưới dạng bảng hoặc chỉ kết nối.
Ví dụ, nếu bạn có 3 cột A, B, C chứa các mã sản phẩm và muốn tạo một danh sách duy nhất tất cả các mã đó, Power Query sẽ làm việc này chỉ với vài cú click chuột và bạn có thể refresh lại khi dữ liệu nguồn thay đổi.
Cách này thực sự rất hữu ích cho những ai thường xuyên phải làm việc với việc tổng hợp và làm sạch dữ liệu. Ai đã từng dùng Power Query cho việc này thì chia sẻ thêm kinh nghiệm nhé!