Chào mọi người,
Dạo này mình hay gặp phải mấy file Excel mà dữ liệu nó cứ 'trộn lộn' vào nhau, kiểu như một ô có nhiều thông tin mà mình muốn tách ra để phân tích cho dễ. Ví dụ, một cột ghi 'Hà Nội - Quận 1 - Nguyễn Du', giờ mình muốn tách riêng Tỉnh/Thành phố, Quận/Huyện, và Tên đường để làm báo cáo chẳng hạn.
Mình biết là có thể dùng Text to Columns hoặc các hàm như LEFT, RIGHT, MID kết hợp FIND, SEARCH. Tuy nhiên, với những trường hợp dữ liệu không đồng nhất, ví dụ có chỗ chỉ có Tỉnh, có chỗ có thêm Phường/Xã, thì dùng công thức khá là phức tạp và dễ sai sót.
Gần đây, mình có mày mò và thấy Power Query xử lý vụ này cực kỳ hiệu quả. Chỉ với vài bước đơn giản, mình có thể tách các thông tin này ra thành các cột riêng biệt một cách 'sạch sẽ' và tự động cập nhật khi dữ liệu gốc thay đổi.
Cách làm cơ bản mình hay dùng:
- Chọn vùng dữ liệu cần xử lý, vào tab Data >> From Table/Range.
- Trong cửa sổ Power Query Editor, chọn cột chứa dữ liệu 'trộn'.
- Vào tab Add Column >> Custom Column.
- Tại đây, mình sẽ dùng các hàm như
Text.SplithoặcText.BetweenDelimitersđể tách chuỗi dựa vào ký tự phân tách (ví dụ: dấu '-'). - Sau khi tách, mình có thể loại bỏ các cột không cần thiết và đổi tên các cột mới cho phù hợp.
- Cuối cùng, chọn Close & Load To... để đưa dữ liệu đã xử lý về lại Excel.
Cách này giúp mình tiết kiệm rất nhiều thời gian so với làm thủ công. Ai đã từng gặp tình huống tương tự và có cách xử lý khác hay hơn thì chia sẻ cho mình với nhé!