Chào các anh chị em trong diễn đàn,
Dạo này công việc của mình hay phải tổng hợp dữ liệu từ nhiều nguồn khác nhau, mà đôi khi các nguồn này lại có những mục trùng lặp. Mình đang loay hoay tìm cách để lấy ra một danh sách duy nhất (unique list) từ nhiều cột mà không phải làm thủ công từng bước. Sau một hồi mày mò, mình phát hiện ra Power Query có một cách làm khá hay ho và hiệu quả.
Tình huống của mình là có một bảng Excel với vài cột chứa các mục, ví dụ như danh sách khách hàng từ các chi nhánh khác nhau. Mình muốn gom tất cả lại thành một danh sách duy nhất, loại bỏ hết các tên bị lặp.
Cách làm mình áp dụng như sau:
- Bước 1: Tải dữ liệu vào Power Query (Chọn vùng dữ liệu -> Data -> From Table/Range).
- Bước 2: Chọn các cột cần tổng hợp. Sau đó vào tab Transform -> Unpivot Columns. Thao tác này sẽ gom các cột lại thành 2 cột: 'Attribute' (tên cột gốc) và 'Value' (giá trị trong cột đó).
- Bước 3: Bỏ cột 'Attribute' đi (chuột phải -> Remove).
- Bước 4: Bây giờ mình chỉ còn cột 'Value' chứa tất cả các mục. Chọn cột 'Value' -> tab Home -> Remove Duplicates.
- Bước 5: Load kết quả trở lại Excel (Close & Load To...).
Kết quả là mình có ngay một danh sách các mục duy nhất, không hề bị trùng lặp, mà lại có thể tự động cập nhật nếu dữ liệu nguồn thay đổi. Cách này rất tiện lợi, đặc biệt với các file lớn hoặc khi cần làm thường xuyên.
Không biết có anh em nào có cách nào khác hay hơn hoặc có mẹo gì với Power Query để làm việc này không? Chia sẻ cho mình với nhé!
Cảm ơn mọi người đã đọc bài!