Chào mọi người,
Mình thường xuyên phải làm việc với các file dữ liệu mà trong một ô lại chứa nhiều giá trị, cách nhau bởi dấu phẩy, chấm phẩy hoặc ký tự đặc biệt khác. Ví dụ như danh sách các mặt hàng đã bán trong một hóa đơn, hoặc danh sách các tag liên quan đến một bài viết.
Việc này gây khó khăn khi muốn phân tích hoặc đếm số lượng từng loại giá trị. Trước đây, mình thường phải dùng các hàm Text to Columns, Find & Replace hoặc thậm chí là viết VBA. Nhưng từ khi biết đến Power Query, mọi thứ trở nên đơn giản hơn rất nhiều.
Hôm nay, mình muốn chia sẻ cách xử lý loại dữ liệu này bằng Power Query, cụ thể là sử dụng chức năng Split Column by Delimiter và sau đó là Unpivot Columns.
Các bước thực hiện cơ bản:
- Load dữ liệu vào Power Query.
- Chọn cột chứa nhiều giá trị.
- Vào tab Add Column -> Split Column -> By Delimiter.
- Chọn dấu phân cách (hoặc custom).
- Sau khi tách cột, bạn sẽ có nhiều cột mới. Chọn tất cả các cột vừa tách, vào tab Transform -> Unpivot Columns.
- Kết quả là bạn sẽ có một cột mới chứa từng giá trị riêng lẻ, rất tiện lợi cho việc phân tích.
Cách này giúp tự động hóa việc xử lý, đặc biệt với các file lớn. Ai đã từng gặp trường hợp tương tự và có cách xử lý khác hiệu quả hơn không? Cùng thảo luận nhé!