Chào mọi người,
Mình thường xuyên phải làm việc với các file Excel có dữ liệu ở nhiều cột khác nhau, và đôi khi mình cần tạo ra một danh sách duy nhất (unique list) từ tất cả các giá trị trong những cột đó. Ví dụ, mình có một bảng danh sách các sản phẩm được bán ở nhiều cửa hàng, và mỗi cửa hàng có thể bán cùng một sản phẩm. Mình muốn tạo một danh sách tất cả các sản phẩm duy nhất mà không bị lặp lại.
Trước đây, mình thường phải copy-paste dữ liệu ra một cột mới rồi dùng chức năng Remove Duplicates, hoặc dùng các công thức mảng phức tạp. Nhưng từ khi biết đến Power Query, mọi thứ trở nên đơn giản hơn rất nhiều.
Cách làm của mình như sau:
- Chọn vùng dữ liệu cần xử lý.
- Vào tab Data -> From Table/Range để mở Power Query Editor.
- Chọn các cột mà bạn muốn lấy giá trị duy nhất.
- Trong tab Transform, tìm đến nhóm Any Column và chọn Unpivot Columns. Thao tác này sẽ chuyển các cột đã chọn thành hai cột: 'Attribute' (tên cột gốc) và 'Value' (giá trị).
- Bỏ chọn cột 'Attribute' (nếu không cần thiết).
- Chọn cột 'Value'.
- Vào tab Home -> Remove Rows -> Remove Duplicates.
- Cuối cùng, vào tab Home -> Close & Load To... để tải kết quả về Excel dưới dạng bảng hoặc chỉ tạo kết nối.
Cách này giúp mình tiết kiệm rất nhiều thời gian và tránh sai sót, đặc biệt khi dữ liệu lớn. Có ai có cách nào khác hay hơn hoặc muốn thảo luận thêm về Power Query không ạ?