Chào các anh chị em trong diễn đàn Sheet & Excel!
Dạo này công việc mình hay gặp phải tình huống dữ liệu bị 'chồng chéo', tức là một dòng dữ liệu chứa nhiều thông tin mà mình cần tách ra hoặc gom nhóm lại để phân tích. Ví dụ, trong một bảng tính bán hàng, một ô có thể chứa nhiều mặt hàng được liệt kê bằng dấu phẩy. Việc này gây rất nhiều khó khăn khi muốn tính toán doanh thu theo từng mặt hàng.
Trước đây, mình thường phải dùng các hàm như TEXTSPLIT (nếu Excel có hỗ trợ) hoặc kết hợp nhiều hàm khác để xử lý, rất mất thời gian và dễ sai sót. Tuy nhiên, gần đây mình có tìm hiểu và thấy Power Query là một công cụ cực kỳ mạnh mẽ để giải quyết vấn đề này một cách tự động và hiệu quả.
Mình muốn chia sẻ với mọi người một cách dùng Power Query để xử lý dữ liệu 'chồng chéo' như sau:
- Bước 1: Tải dữ liệu vào Power Query Editor.
- Bước 2: Sử dụng chức năng 'Split Column' (Tách Cột) để tách các giá trị trong ô theo dấu phân cách (ví dụ: dấu phẩy). Chọn 'Split Column by Delimiter' và chọn dấu phẩy.
- Bước 3: Sau khi tách, bạn có thể có nhiều cột mới. Nếu muốn gom nhóm lại theo một cột nào đó (ví dụ: gom các mặt hàng lại), bạn có thể sử dụng chức năng 'Group By' (Nhóm Theo).
- Bước 4: Chọn cột cần nhóm, sau đó chọn cột chứa các giá trị cần gom và chọn phép toán tổng hợp (ví dụ: Sum, Count, Average). Nếu muốn gom các mặt hàng đã tách ra thành một danh sách, bạn có thể chọn 'All Rows' và sau đó dùng hàm
Text.Combineđể nối chúng lại.
Cách này giúp mình tiết kiệm rất nhiều thời gian và đảm bảo tính chính xác cho dữ liệu. Anh em nào đã từng gặp khó khăn với loại dữ liệu này thì thử áp dụng xem sao nhé. Nếu có cách nào hay hơn hoặc gặp vướng mắc gì, mọi người cùng thảo luận cho vui!