Chào mọi người,
Dạo gần đây mình có làm việc với một tệp dữ liệu khá lớn, có nhiều cột và yêu cầu gom nhóm theo nhiều điều kiện khác nhau, trong đó có cả những điều kiện hơi "xoắn não" một chút. Thay vì dùng các hàm lồng nhau như SUMIFS hay PivotTable, mình đã thử sức với Power Query và kết quả thật sự bất ngờ về sự linh hoạt và hiệu quả của nó.
Cụ thể, mình có một bảng dữ liệu bán hàng bao gồm các cột: Ngày, Sản phẩm, Khu vực, Số lượng, Đơn giá. Yêu cầu đặt ra là cần tổng hợp doanh thu theo Sản phẩm và Khu vực, nhưng có thêm điều kiện lọc là chỉ tính những đơn hàng có Số lượng lớn hơn 10.
Trước đây, có lẽ mình sẽ phải tạo thêm một cột phụ để đánh dấu các đơn hàng thỏa mãn điều kiện, sau đó mới tiến hành nhóm. Nhưng với Power Query, mọi thứ trở nên đơn giản hơn rất nhiều:
- Bước 1: Load dữ liệu vào Power Query.
- Bước 2: Sử dụng chức năng "Giữ các hàng" (Keep Rows) -> "Giữ các hàng có giá trị" (Keep Rows by Condition) để lọc ra những đơn có Số lượng > 10.
- Bước 3: Chọn cột 'Sản phẩm' và 'Khu vực', sau đó vào tab "Transform" chọn "Nhóm theo" (Group By).
- Bước 4: Cấu hình Group By: Chọn "Nâng cao" (Advanced), thêm các cột 'Sản phẩm' và 'Khu vực' vào "Group by". Ở phần "Các phép toán mới" (New column name), đặt tên là "Doanh thu", chọn "Phép toán" là "Sum", và "Cột" là Doanh giá (mình sẽ tạo cột này trước đó bằng cách "Thêm cột" -> "Cột tùy chỉnh" với công thức
[Số lượng] * [Đơn giá]).
Kết quả là mình có ngay một bảng tổng hợp doanh thu theo Sản phẩm và Khu vực, chỉ tính những đơn hàng lớn. Quá tiện lợi phải không?
Không biết có anh em nào có kinh nghiệm xử lý các trường hợp nhóm dữ liệu phức tạp hơn bằng Power Query không? Chia sẻ thêm cho mọi người cùng học hỏi nhé!